标签： http

HTTP 请求夹带(smuggling)攻击

2021年6月29日
http
HTTP 请求夹带(smuggling)攻击已关闭评论

什么是HTTP请求夹带(smuggling)攻击

HTTP请求走私是一种干扰网站处理从一个或多个用户接收的HTTP请求序列的方式的技术。

请求夹带漏洞危害，允许攻击者绕过安全控制，获取对敏感数据的未授权访问，并直接危及其他应用程序用户。

%title插图%num

HTTP请求夹带攻击是怎么发生的？

今天的Web应用程序经常在用户和*终应用程序逻辑之间使用HTTP服务器链。

用户将请求发送到前端服务器（有时称为负载平衡器或反向代理），此服务器将请求转发给一个或多个后端服务器。

在现代基于云的应用程序中，这种类型的体系结构越来越常见，并且在某些情况下是不可避免的。

当前端服务器将HTTP请求转发到后端服务器时，它通常通过相同的后端网络连接发送多个请求，因为这样做效率更高，性能更高。

协议非常简单：HTTP请求一个接一个地发送，接收服务器解析HTTP请求标头以确定一个请求结束的位置和下一个请求的开始：

%title插图%num

在这种情况下，前端和后端系统就请求之间的界限达成一致至关重要。否则，攻击者可能会发送一个模糊的请求，前端和后端系统会对其进行不同的解释：

%title插图%num

在这里，攻击者将后端服务器的部分前端请求解释为下一个请求的开始。它有效地预先附加到下一个请求，因此可能会干扰应用程序处理请求的方式。这是一次请求夹带攻击，它可能会造成严重的后果。

如何构造 HTTP 请求夹带漏洞

HTTP请求夹带漏洞出现的原因是因为HTTP规范提供了两种不同的方式来指定请求的结束位置：Content-Length标头和Transfer-Encoding标头。
Content-Length标头很简单，它以字节为单位指定消息体的长度。例如：

POST /search HTTP/1.1
Host: normal-website.com
Content-Type: application/x-www-form-urlencoded
Content-Length: 11
q=smuggling

Transfer-Encoding标头可用于指定消息体使用分块编码。
这意味着报文包含一个或多个数据块。每个块包含以字节为单位的块大小（以十六进制表示），后跟换行符，后跟块内容。消息以大小为零的块结束。例如：

POST /search HTTP/1.1
Host: normal-website.com
Content-Type: application/x-www-form-urlencoded
Transfer-Encoding: chunked

b
q=smuggling
0

由于HTTP规范提供了两种不同的方法来指定HTTP消息的长度，因此单个消息可以同时使用这两种方法，这样它们就会相互冲突。

HTTP规范试图通过声明防止此问题，如果Content-Length和Transfer-Encoding标头都存在，则应忽略Content-Length标头。这可能足以避免在只有一台服务器正在运行时出现歧义，但在两台或多台服务器链接在一起时则不行。

在这种情况下，出现问题有两个原因：
1.某些服务器不支持请求中的Transfer-Encoding标头。
2.如果标头以某种方式进行模糊处理，则可能会导致某些支持Transfer-Encoding标头的服务器不处理它。

如果前端服务器和后端服务器与（可能模糊的）Transfer-Encoding标头的行为不同，那么他们可能不同意连续请求之间的边界，从而导致请求夹带漏洞。

如何执行HTTP请求夹带攻击

请求夹带攻击涉及将Content-Length头和Transfer-Encoding头放入单个HTTP请求并对其进行操作，以便前端和后端服务器以不同方式处理请求。完成此操作的确切方式取决于两台服务器的行为：

CL.TE：前端服务器使用Content-Length头，后端服务器使用Transfer-Encoding头。
TE.CL：前端服务器使用Transfer-Encoding标头，后端服务器使用Content-Length标头。
TE.TE：前端和后端服务器都支持Transfer-Encoding标头，但是可以通过以某种方式模糊标头来诱导其中一个服务器不处理它

CL.TE漏洞

这里前端服务器使用Content-Length头，后端服务器使用Transfer-Encoding头。我们可以执行简单的HTTP请求夹带攻击，如下所示：

POST / HTTP/1.1
Host: vulnerable-website.com
Content-Length: 13
Transfer-Encoding: chunked

0

SMUGGLED

前端服务器处理Content-Length头并确定请求主体长度为13个字节，直到SMUGGLED结束。此请求将转发到后端服务器。

后端服务器处理Transfer-Encoding标头，因此将消息体视为使用分块编码。

它处理*个块，它被称为零长度，因此被视为终止请求。以下字节SMUGGLED未经处理，后端服务器将这些字节视为序列中下一个请求的开始。

TE.CL漏洞
这里，前端服务器使用Transfer-Encoding标头，后端服务器使用Content-Length标头。我们可以执行简单的HTTP请求夹带攻击，如下所示：

POST / HTTP/1.1
Host: vulnerable-website.com
Content-Length: 3
Transfer-Encoding: chunked

8
SMUGGLED
0

注意:
要使用Burp Repeater发送此请求，您首先需要转到Repeater菜单，并确保未选中“Update Content-Length”选项。
您需要在*后的0之后包含尾随序列\r\n\r\n

前端服务器处理Transfer-Encoding标头，因此将消息体视为使用分块编码。它处理*个块，长度为8个字节，直到SMUGGLED之后的行的开头。它处理第二个块，它被称为零长度，因此被视为终止请求。此请求将转发到后端服务器。
后端服务器处理Content-Length标头并确定请求主体长度为3个字节，直到8之后的行的开头。以SMUGGLED开头的以下字节未经处理，后端服务器将这些视为序列中下一个请求的开头。

TE.TE行为：混淆TE头、

这里，前端和后端服务器都支持Transfer-Encoding标头，但是可以通过以某种方式模糊标头来诱导其中一个服务器不处理它。

有可能无休止地混淆Transfer-Encoding标头。例如：

Transfer-Encoding: xchunked

Transfer-Encoding : chunked

Transfer-Encoding: chunked
Transfer-Encoding: x

Transfer-Encoding:[tab]chunked

[space]Transfer-Encoding: chunked

X: X[\n]Transfer-Encoding: chunked

Transfer-Encoding
: chunked

这些技术中的每一种都涉及到与HTTP规范的细微偏离。实现协议规范的实际代码很少以*对精度遵守它，并且不同的实现通常容忍规范的不同变化。要发现TE.TE漏洞，有必要找到Transfer-Encoding标头的一些变体，以便只有一个前端或后端服务器处理它，而另一个服务器忽略它。

根据是否可以诱导不处理混淆的Transfer-Encoding标头的前端服务器或后端服务器，攻击的其余部分将采用与CL.TE或TE.CL漏洞相同的形式已经描述过。

如何防止HTTP请求夹带漏洞

在前端服务器通过同一网络连接将多个请求转发到后端服务器的情况下会出现HTTP请求走私漏洞，并且用于后端连接的协议存在两个服务器不同意关于两者之间边界的风险要求。防止HTTP请求走私漏洞的一些通用方法如下：

禁用后端连接的重用，以便通过单独的网络连接发送每个后端请求。
使用HTTP / 2进行后端连接，因为此协议可防止请求之间的边界模糊不清。
为前端和后端服务器使用完全相同的Web服务器软件，以便他们就请求之间的界限达成一致。
在某些情况下，可以通过使前端服务器规范化模糊请求或使后端服务器拒*模糊请求并关闭网络连接来避免漏洞。然而，这些方法可能比上面确定的通用缓解更容易出错。

web-security 练习
要解决实验问题，请将请求走私到后端服务器，以便后端服务器处理的下一个请求似乎使用GPOST方法。

HTTP接口的服务端和客户端的实现

2021年6月26日
http
HTTP接口的服务端和客户端的实现已关闭评论

Json大量字段案例（300多个key），需要做一个客户中心抽调各个系统的客户信息的功能，在每个系统中需要写客户端代码，在客户中心系统需要写服务端代码。

客户端：

json串截图如下，注意在json结构中有对象也有数组也就是集合。在java类和json对象的互相转换过程中，如果将json串转换成java类对象，在里层的特殊类型，也就是[]集合的，我们需要进行特殊的处理。
%title插图%num

1.创建线程：（向客户中心推送客户信息时，前提是不能影响本系统的流程，也就是说不管你借口中的方法是否报错借口是否通都不能影响源代码的正常秩序，因为我们新增了线程），内部类。

try {

Thread thread = new Thread(new Runnable() {

public void run() {

//次数写客户端调用接口的相关方法

}

});

thread.start();

} catch (Exception e) {

e.printStackTrace();

}

根据json的结构构建出对应的java类来。一层一层的写java类，查询出所有需要的信息赋值到java类对象中后，将对象转化成可以推送的json对象

JSONObject fromObject = JSONObject.fromObject(customerCenter,jsonExcludeEmpty());

private JsonConfig jsonExcludeEmpty(){//去除空的json键值对

JsonConfig jsonConfig = new JsonConfig();

jsonConfig.setJsonPropertyFilter(new PropertyFilter() {

@Override

public boolean apply(Object source, String name, Object value) {

return value == null;

}

});

return jsonConfig;

}

调用HTTP工具类推送信息调用接口，*后获得接口的返回值result.

同样在获取数据本系统做保存时，调用接口后获得返回值result

JSONObject jsonObject = JSONObject.fromObject(result);

String status = jsonObject.getString(“status”).trim();

//过滤掉不需要处理的json对象

JsonConfig config=new JsonConfig ();

config.setExcludes(new String[]{“educationInfos”,”carInfo”,”houseInfo”});

JSONObject dataJSON = new JSONObject().fromObject(data,config);

//json转java对象特殊的类型需要单独处理，比如list [ ]中括号

Map<String, Class> classMap = new HashMap<String, Class>();

classMap.put(“phones”, CustomerCenterPhone.class);

classMap.put(“companyPhones”, CustomerCenterPhone.class);

classMap.put(“emails”, CustomerCenterEmail.class);

……………………..
CustomerCenter customerCenter =(CustomerCenter)JSONObject.toBean(dataJSON,CustomerCenter.class,classMap);

这样就获得到了*外层整体的对象CustomerCenter ，在这个对象中，我做的这个项目有300多个字段。里面的对象和集合还是比较多的，在做的时候要仔细的核对好。

服务端：

http服务端的代码一般不是在service类或是接口中写，而是直接写在controller中，因为是http的嘛，就和一个页面访问一样先进入到controller层，类的注解不变还是@Controller@RequestMapping(value=”/ApplicationController”)两个后面的是访问的名称。在方法上有了一些变化，先看下面的代码：
@RequestMapping(value=”/approveResult”,method = RequestMethod.POST)
public void approveResult(@RequestBody PharosResultPojo pharosResultPojo,HttpServletRequest request,HttpServletResponse response){
//PharosResultPojo 这个是接受数据的java类
//里面直接写相应的功能，在处理完后，需要给调用者返回处理的结果
PrintWriter out;
out = response.getWriter();
JSONObject result = new JSONObject();
result.put(“result”, “ok”);
out.write(result.toString());
out.flush();
out.close();
}
//我们看到在除了平时要使用的方法访问名称后，又加了个参数method = RequestMethod.POST，这个就是规定你http服务端的这个接口方法是post还是get方式。在方法参数列表中要加上这个注解@RequestBody 以及HttpServletRequest request,HttpServletResponse response两个参数。在controller中写了以上的内容后我们只需要完成*后一步http服务端就完成了。那么我们的java代码已经写好了，想要和页面上的一样访问到我们的后台，那我们还需要一个什么操作呢？既然是接口，那么一般肯定是其它的系统访问，我们知道的是自己系统的类其它类是不能直接去访问的，我们需要将这个类给取消拦截，也就是让其它系统可以访问，这一步是在配置文件中实现的，每个公司的项目的结构一般都不一样，有很多公司是在applicationContext-security.xml这个xml中配置，
<b:bean id=”resourceDetailsService”
class=”*********.security.ResourceDetailsServiceImp”>
<b:property name=”filterURL”>
<b:map>
<b:entry key=”/ApplicationController/**” value=”ROLE_ANONYMOUS” />
直接将这个类给取消拦截，具体的在xml中的写法，有一些是公司封装的比较详细，如果你做的项目什么都没有的话，那么你可以在网上搜索一下如何在spring mvc项目（我公司用的是spring mvc项目这个框架）中取消controller类的访问拦截，应该很简单的。

简单了解ftp协议和http协议

2021年6月24日
FTP, http
简单了解ftp协议和http协议已关闭评论

（一）常见协议及端口

（1）. HTTP协议代理服务器常用端口号：80/8080/3128/8081/9080
（2）. SOCKS代理协议服务器常用端口号：1080
（3）. FTP（文件传输）协议代理服务器常用端口号：21
（4）. Telnet（远程登录）协议代理服务器常用端口：23

（二）FTP协议
FTP端口号是 21
FTP的端口号能改
ftp的端口号20、21的区别一个是数据端口，一个是控制端口，控制端口一般为21，而数据端口不一定是20，这和FTP的应用模式有关，如果是主动模式，应该为20，如果为被动模式，由服务器端和客户端协商而定.
21端口主要用于FTP（File Transfer Protocol，文件传输协议）服务，FTP服务主要是为了在两台计算机之间实现文件的上传与下载，一台计算机作为FTP客户端，另一台计算机作为FTP服务器，可以采用匿名（anonymous）登录和授权用户名与密码登录两种方式登录FTP服务器。
一个主动模式的FTP连接建立要遵循以下步骤：
客户端打开一个随机的端口（端口号大于1024，在这里，我们称它为x），同时一个FTP进程连接至服务器的21号命令端口。此时，源端口为随机端口x，在客户端，远程端口为21，在服务器。
客户端开始监听端口（x+1），同时向服务器发送一个端口命令（通过服务器的21号命令端口），此命令告诉服务器客户端正在监听的端口号并且已准备好从此端口接收数据。这个端口就是我们所知的数据端口。
服务器打开20号源端口并且建立和客户端数据端口的连接。此时，源端口为20，远程数据端口为（x+1）。
客户端通过本地的数据端口建立一个和服务器20号端口的连接，然后向服务器发送一个应答，告诉服务器它已经建立好了一个连接。
（三）http协议

特点：

HTTP协议永远都是客户端发起请求，服务器回送响应。这样就限制了使用HTTP协议，无法实现在客户端没有发起请求的时候，服务器将消息推送给客户端。

HTTP协议的主要特点可概括如下：
1、支持客户/服务器模式。支持基本认证和安全认证。
2、简单快速：客户向服务器请求服务时，只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单，使得HTTP服务器的程序规模小，因而通信速度很快。
3、灵活：HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
4、HTTP 0.9和1.0使用非持续连接：限制每次连接只处理一个请求，服务器处理完客户的请求，并收到客户的应答后，即断开连接。HTTP 1.1使用持续连接：不必为每个web对象创建一个新的连接，一个连接可以传送多个对象，采用这种方式可以节省传输时间。
5、无状态：HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息，则它必须重传，这样可能导致每次连接传送的数据量增大。

有什么可以经过 HTTP 代理来反代网站的工具？

2021年6月23日
http
有什么可以经过 HTTP 代理来反代网站的工具？已关闭评论

用于反代的机器需要通过一个 HTTP 代理服务器才能连接反代的目标服务器，有什么可以经过 HTTP 代理来反代网站的工具？
反代代理服务器工具11 条回复 • 2021-06-23 10:04:19 +08:00
wengych 1
wengych 15 小时 6 分钟前 via iPhone
nginx….
wengych 2
wengych 15 小时 6 分钟前 via iPhone
privoxy
Rocketer 3
Rocketer 15 小时 3 分钟前 via iPhone
nginx，还能附加 ssl
est 4
est 15 小时 1 分钟前
cloudflared （旧称 argo ）试试
theklf4 5
theklf4 13 小时 12 分钟前 via iPhone
@wengych
@Rocketer
nginx 文档看了很多遍，没找到使用 HTTP 代理服务器连接目标的方法
hongdaworks 6
hongdaworks 10 小时 31 分钟前
nginx ssl 。
谷歌 Http 反向代理 Https 反向代理
NSAgold 7
NSAgold 9 小时 35 分钟前 via Android
B 在一个需要 http 代理才能访问 A 的环境下
现在希望 C 通过直接访问 B 的反代来实现访问 A

是不是这个意思
theklf4 8
theklf4 5 小时 11 分钟前 via iPhone
@NSAgold 是的
lx0758 9
lx0758 5 小时 8 分钟前 via Android
fd or charles
no1xsyzy 10
no1xsyzy 4 小时 25 分钟前
https://stackoverflow.com/q/46803431/6202760
其实你想要的东西叫做『 HTTP 代理转换成（特定目标的）透明代理』

如果该网站有 HTTPS，而你不需要解包的话甚至可以直接做「 SNI 代理」

lbp0200 11
lbp0200 3 小时 49 分钟前
你搜一下，NGINX 配合 Tomcat

HTTP代理服务器的工作原理

2021年6月2日
http
HTTP代理服务器的工作原理已关闭评论

在HTTP通信链上，客户端和目标服务器之间通常存在某些中转代理服务器，它们提供对目标资源的中转访问。一个HTTP请求可能被多个代理服务器转发，后面的服务器称为前面服务器的上游服务器。代理服务器按照其使用方式和作用，分为正向代理服务器、反向代理服务器、透明代理服务器。

正向代理要求客户端自己设置代理服务器的地址。客户的每次请求都将直接发送到该代理服务器，并由代理服务器来请求目标资源。比如处于防火墙内的局域网机器要访问Internet，或者要访问一些被屏蔽掉的国外网站，就需要使用正向代理服务器。

反向代理服务器则被设置在服务器端，因而客户端无须进行任何设置。反向代理服务器来接收Internet上的连接请求，然后将请求转发给内部网络上的服务器，并将从内部服务器上得到的结果返回给客户端。在这种情况下，代理服务器对外就表现为一个真实的服务器。

透明代理只能设置在网关上。用户访问Internet的数据报必然都经过网关，如果在网关上设置代理，则该代理对用户来说显然是透明的。透明代理可以看作正向代理的一种特殊情况。

代理服务器通常还提供缓存目标资源的功能（可选），这样用户下次访问同一资源时速度将很快。

什么是http服务器

2021年5月18日
http
什么是http服务器已关闭评论

本篇文章旨在从服务器后台开发的角度剖析一个简单的http服务器的运行原理.

我们知道浏览器是http(s)的客户端,目的是连接远程的http服务器,然后服务器返回浏览器数据.浏览器接收数据解析数据之后展现出来.我们看到的外在表现就是,浏览器访问一个url,然后就得到相应的web页面.

同样我们知道,浏览器与http服务器是通过http协议,传输层是tcp协议,因为他是有连接,可靠的协议.关于http协议简单的介绍一下:

一个标准的HTTP请求由以下几个部分组成

<request-line>
<headers>
<CRLF>
[<request-body><CRLF>]

在HTTP请求中，*行是请求行（request-line），用来说明请求类型、要访问的资源（URL）以及使用的HTTP版本；
紧接着是多行头部（headers）信息，用来说明服务器要使用的附加信息；
头部信息之后是一个回车换行符（\r\n），用于标明头部信息的结束。
以上是必须内容，根据需要可在头部信息结束之后增加主体数据（request-body）；

主体数据之后是一个回车换行符（\r\n），用于标明主体数据的结束。

例如，我们可以在IE浏览器上输入下面的网址：

http://localhost:8000/hello/index.html

HTTP请求的头部信息如下：

GET /hello/index.html HTTP/1.1
Accept: */*
Accept-Language: zh-cn
Accept-Encoding: gzip, deflate
Host: localhost:8000
Connection: Keep-Alive
Cookie: JSESSIONID=BBBA54D519F7A320A54211F0107F5EA6

收到请求数据之后,服务器解析,毕竟是明文字符,这个简单.然后服务器就知道了客户端的要求–获取目录hello/index.html文件.服务器读取文件内容发送给浏览器就好了.

后来随着业务逻辑越来越复杂,单单获取某个html文件功能早已不能满足需求,个性化需求呼之欲出.比如在线问卷调查表,他究竟是怎么把我们填写的数据传递给服务器的呢?

你可能会说那不是一样,客户端发送什么内容,服务器就接收什么内容.可是你想过没有,每个网站的需求是不一样的,本来服务器接收到浏览器的请求数据已经是够复杂的了,还让服务器来解析数据并响应不同的数据处理,这不太现实.

一般的,服务器*好只接收数据,如果让服务器也处理数据逻辑,势必会让服务器变得很复杂,稳定性也得不到保证.

另外一个角度是为了让程序复用,提高生产效率.也就是说,如果不关注业务逻辑,只注重接收数据,那么服务器程序可以给任何一个开发者使用.换句话说,我们不用从头开始写.直接使用现有的高性能的服务器就可以满足需求了.例如公司白领中午要吃饭,不可能跑回家自己去做饭吃,自己叫外卖就好了.

但是现实问题仍然没有解决,通过什么方式去处理业务逻辑呢?

你要给手机充电时,把插头插入插线板就能获取电了.插线板有接口,提供了电.

同理服务器程序*好也提供接口,浏览器通过统一的接口给服务器,然后我们从服务器接口中获取我们想要的数据.获取数据之后我们可以把数据交给第三方程序来处理逻辑,这样就做到与服务器业务分离了,good iead.

事实上,现在的http服务器就是这么做的,不过很复杂而已.下一篇开始为您介绍这些接口.

附录:HTTP Request Header 请求头

Header	解释	示例
Accept	指定客户端能够接收的内容类型	Accept: text/plain, text/html
Accept-Charset	浏览器可以接受的字符编码集。	Accept-Charset: iso-8859-5
Accept-Encoding	指定浏览器可以支持的web服务器返回内容压缩编码类型。	Accept-Encoding: compress, gzip
Accept-Language	浏览器可接受的语言	Accept-Language: en,zh
Accept-Ranges	可以请求网页实体的一个或者多个子范围字段	Accept-Ranges: bytes
Authorization	HTTP授权的授权证书	Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
Cache-Control	指定请求和响应遵循的缓存机制	Cache-Control: no-cache
Connection	表示是否需要持久连接。（HTTP 1.1默认进行持久连接）	Connection: close
Cookie	HTTP请求发送时，会把保存在该请求域名下的所有cookie值一起发送给web服务器。	Cookie: $Version=1; Skin=new;
Content-Length	请求的内容长度	Content-Length: 348
Content-Type	请求的与实体对应的MIME信息	Content-Type: application/x-www-form-urlencoded
Date	请求发送的日期和时间	Date: Tue, 15 Nov 2010 08:12:31 GMT
Expect	请求的特定的服务器行为	Expect: 100-continue
From	发出请求的用户的Email	From: user@email.com
Host	指定请求的服务器的域名和端口号	Host: www.zcmhi.com
If-Match	只有请求内容与实体相匹配才有效	If-Match: “737060cd8c284d8af7ad3082f209582d”
If-Modified-Since	如果请求的部分在指定时间之后被修改则请求成功，未被修改则返回304代码	If-Modified-Since: Sat, 29 Oct 2010 19:43:31 GMT
If-None-Match	如果内容未改变返回304代码，参数为服务器先前发送的Etag，与服务器回应的Etag比较判断是否改变	If-None-Match: “737060cd8c284d8af7ad3082f209582d”
If-Range	如果实体未改变，服务器发送客户端丢失的部分，否则发送整个实体。参数也为Etag	If-Range: “737060cd8c284d8af7ad3082f209582d”
If-Unmodified-Since	只在实体在指定时间之后未被修改才请求成功	If-Unmodified-Since: Sat, 29 Oct 2010 19:43:31 GMT
Max-Forwards	限制信息通过代理和网关传送的时间	Max-Forwards: 10
Pragma	用来包含实现特定的指令	Pragma: no-cache
Proxy-Authorization	连接到代理的授权证书	Proxy-Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
Range	只请求实体的一部分，指定范围	Range: bytes=500-999
Referer	先前网页的地址，当前请求网页紧随其后,即来路	Referer: http://www.zcmhi.com/archives/71.html
TE	客户端愿意接受的传输编码，并通知服务器接受接受尾加头信息	TE: trailers,deflate;q=0.5
Upgrade	向服务器指定某种传输协议以便服务器进行转换（如果支持）	Upgrade: HTTP/2.0, SHTTP/1.3, IRC/6.9, RTA/x11
User-Agent	User-Agent的内容包含发出请求的用户信息	User-Agent: Mozilla/5.0 (Linux; X11)
Via	通知中间网关或代理服务器地址，通信协议	Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
Warning	关于消息实体的警告信息	Warn: 199 Miscellaneous warning

深入分析：TCPIP，HTTP代理和socks之间的区别

2021年5月13日
http, socks, TCPIP
深入分析：TCPIP，HTTP代理和socks之间的区别已关闭评论

我们知道，网络由下往上可分为7层：物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。

其中，IP协议对应于网络层，TCP协议对应于传输层，而HTTP协议对应于应用层，三者从本质上来说没有可比性，socket则是对TCP/IP协议的封装和应用。也可以说，TPC/IP协议是传输层协议，主要解决数据如何在网络中传输，而HTTP是应用层协议，主要解决如何包装数据。

关于TCP/IP和HTTP协议的关系，网络有一段比较容易理解的介绍：“我们在传输数据时，可以只使用TCP/IP协议，但是那样的话，如果没有应用层，便无法识别数据内容。如果想要使传输的数据有意义，则必须使用到应用层协议。
而我们平时说的*多的socket是什么呢，实际上socket是对TCP/IP协议的封装，Socket本身并不是协议，而是一个调用接口。通过Socket，我们才能使用TCP/IP协议。实际上，Socket跟TCP/IP协议没有必然的联系。

一次完整的HTTP通信中，web浏览器和web服务器之间完成的七个步骤

2021年5月10日
http, Web服务器, web浏览器
一次完整的HTTP通信中，web浏览器和web服务器之间完成的七个步骤已关闭评论

1、建立TCP连接：

在HTTP工作开始之前，web浏览器首先要通过网络与web服务器建立连接，该连接是通过TCP来完成的。

为什么要先建立TCP呢？

因为HTTP是比TCP更高层次的应用层协议，根据规则，只有低层协议建立之后才能进行更高层次协议的连接，因此要先建立TCP连接，一般TCP连接的端口号是80

2、web浏览器向web服务器发送请求指令

一旦建立了TCP连接，web浏览器就会向web服务器发送请求指令

其中一部分是请求行，内容包括：请求方法/请求url资源/http协议版本信息；如：(Request-Line) GET /a.html HTTP/1.1

3、web浏览器发送请求头信息

浏览器发送其请求命令之后，还要以头信息的形式向web服务器发送一些别的信息；如：

Host 127.0.0.1

User-Agent Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.9.0.15) Gecko/2009102815 Ubuntu/9.04 (jaunty) Firefox/3.0.15

Accept text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8

Accept-Language zh-cn,zh;q=0.5

Accept-Encoding gzip,deflate

Accept-Charset gb2312,utf-8;q=0.7,;q=0.7

Keep-Alive 300

Connection keep-alive

之后浏览器还会发送一空行来通知服务器，它已经结束了该头信息的发送

4、web服务器做出应答

web服务器收到客户端的请求后，服务器会向客户端回应

其中一部分是响应头信息；内容包括：http版本信息/状态码状态文字（状态短语），如：(Status-Line) HTTP/1.1 200 OK

5、web服务器发送应答头信息

和客户端一样，服务器也会随同发送关于自己的数据以及被请求的文档等信息给客户端；如：

Date Thu, 26 Nov 2009 13:50:54 GMT

Server Apache/2.2.11 (Unix) PHP/5.2.9

Last-Modified Thu, 26 Nov 2009 13:50:19 GMT

Etag “8fb8b-14-4794674acdcc0″

Accept-Ranges bytes

Content-Length 20

Keep-Alive timeout=5, max=100

Connection Keep-Alive

Content-Type text/html

这里面比较重要的属性有：Etag（指示资源的状态唯一标识）、Last-Modified（指示*后修改的时间）、Expires（指示资源在浏览器缓存中的过期时间）

这些属性关系到http的缓存机制（前面的文章有说到HTTP请求中的缓存(cache)机制），同时也与HTTP的断点续传原理有关系（后面有相关文章HTTP 1.1 版本新特性描述）；

6、Web服务器想浏览器发送数据

web服务器发送完头信息后，它也会发送一个空白行来表示头信息的发送到此为止，接着，它就以Content-Type应答头信息所描述的格式发送用户所请求的实际数据

7、web服务器关闭TCP连接

一般情况下，一旦web服务器向浏览器发送了请求数据后，它就要关闭TCP连接，然后如果浏览器或者服务器在其头信息加入这行代码：

connection:keep-alive

这样TCP连接将依然保持打开状态，浏览器可以继续通过相同的连接发送请求，保持连接，节省了为每个请求建立新连接所需要的的事件，同时节省了宽带

实际上，在HTTP 1.1 版本的新特性中有一点是：默认持久连接节省通信量，只要客户端、服务端任意一端没有明确断开TCP连接，可以发送多次HTTP请求

HTTP流媒体播放技术发展以及nginx点播源站

2021年4月16日
http, nginx点播
HTTP流媒体播放技术发展以及nginx点播源站已关闭评论

互联网多媒体内容传输从大方向上可以分为下载传输和流式传输，而流式传输又可以分为顺序流式传输和实时流式传输，换句话来说就是点播(Video on Demand)和直播(Live Streaming)，顾名思义，前者的媒体内容是提前存储在服务器上供客户端请求播放，而后者是实时产生并分发给客户端播放。

本文主要是基于HTTP的流媒体点播技术入门，讲述了一些基本的概念以及这一技术的变革演进。

互联网上传播音视频内容*早从上世纪90年代开始，RTP等专有协议的提出就是定义音视频的包格式以获得更低的网络传递开销。不过现如今的互联网世界，CDN扮演着非常重要的角色，而*大部分CDN厂商是不支持RTP等协议的。基于HTTP的流媒体点播技术则占据着主流，其有几点优势：1、防火墙友好；2、客户端控制媒体流的访问，服务端不需要为每一个客户端连接维护媒体session状态；3、采用标准的HTTP服务器即可，支撑大规模客户端访问不需要额外的服务器技术资源开销，*重要的就是CDN技术的良好支持优化。

HTTP流媒体技术的变革大致经过了以下四个阶段：

*初，我们只能先下载完整视频文件到本地磁盘后，然后才能播放观赏。这意味着你必须等待视频下载操作的完成，严格来讲，根据我们*段的划分，这不能称作为流媒体传输，不过我们还是列出来，以作对比。

在上面简单下载文件的基础上，一个明显的提升就是渐进式下载技术。这种情况下不需要完整下载视频文件，可以边下载边播放，这就要求视频的元数据信息得放在视频文件的开头。但是，我们只能在已经下载的那一部分自由拖拽播放，而未下载的部分是不能播放的。

在渐进式下载的基础上，pseudo-streaming(伪流)出现了，其增强了seek播放功能，也就是支持直接切到未下载的地方进行观看，所以也可以称之为渐进式播放。

其实，到pseudo-streaming 这一步，流媒体播放的技术已经很成熟了，而且目前*大多数的视频网站都是这种技术，比如Youtube、优酷、腾讯视频等。如果，要在这个基础上再一步的优化，可以从哪些方面呢？比较容易想到的就是带宽优化，能够链路感知，这就是下面的自适应比特率流。其原理就是，同一视频内容会有不同的码率版本，客户端播放器会动态地根据网络质量切换请求带宽匹配的的视频片段。

自适应码率流媒体技术，业内比较常见的实现是Apple的HTTP Live Streaming (HLS)以及Adobe的HTTP Dynamic Streaming (HDS)，下图简单展示了HLS的文件结构，可以看到master playlist包含了两种不同码率的播放列表，当然如果你只有一种版本，那么就不需要master playlist了。基于HTTP的自适应码率流媒体是有国际标准的，那就是3GPP组织和MPEG小组所提出的MPEG-DASH(Dynamic Adaptive Streaming over HTTP)。

*后，我们来说说一个简单的点播流媒体服务器是怎么工作的。

目前，很常见的一种搭建方式就是基于nginx，而nginx本身对音视频媒体的处理就有一定的支持，官方就有flv和mp4的插件，即ngx_http_flv_module和ngx_http_mp4_module。前者支持以字节偏移的渐进式seek播放，后者支持以时间偏移的渐进式seek播放。

要想达到这种渐进式播放的目的，大部分情况下，我们是要对服务端的媒体文件进行一定的处理的。首先播放之前，服务端需要先返回一定的视频元数据信息，其次我们需要知道媒体时间和媒体数据的映射关系。为什么呢？

目前大部分的视频编码都采用H264标准，而H264的不同视频帧采用了不同的压缩编码方式，其中I帧的作用很大，其通常是每个 GOP（Group of Picture）的*个帧，我们简单点说，I帧依靠自身就可以解码出完整图像，而其后面帧的解码则需要依赖I帧，这意味着什么？

是的，这决定了我们在拖拽播放的时候，播放器会seek到*近的I帧处，所以有时候会有一个现象，就是你拖到一个精确的时间点，但是播放器却在另一个靠近的时间点开始播放，这就是因为那个时间点是I帧所在之处。

播放器的seek播放通常是让用户选择时间偏移，而服务端*终对文件的请求处理只能是字节偏移，所以问题来了，我们要有一个时间偏移和字节偏移的映射表，严格一点说，是每一个I帧的时间偏移与字节偏移映射。

问题又来了，这个映射是放在客户端还是服务端处理呢？当然是都可以。如果客户端发出字节偏移请求，那么服务端就很轻松，只需要提供HTTP range访问的功能，但是client端需要提前知道时间与字节的映射关系，比如flv格式的metadata就提供了这个信息，有的flv文件没有加入metadata，这时候就需要用相应的flv工具（比如flvmeta）去处理成这样的格式，这样客户端的播放器就可以直接发送字节偏移量了。MP4则不需要这么处理，因为MP4格式本身就要求带这样的信息，其记录metadata的Movie Box (moov)中的Media Information Box (minf)就存储了媒体时间和媒体数据的映射关系。如果客户端只发出时间请求，那么服务端就得将时间偏移请求转换为字节偏移请求，然后处理并响应请求。

上面讲了这么多，那请问，在哪里可以买到牛逼的点播服务呢？

网易视频云推出的一站式视频云点播平台，基于分布式处理集群和大规模分发系统资源，满足全终端设备的播放需求，为企业用户提供*速稳定的视频上传、存储、转码、播放和下载等云服务，欢迎试用购买。

Web服务器工作原理详解

2021年4月15日
http, HTTP服务器, Web服务器
Web服务器工作原理详解已关闭评论

概述：Web服务器概念较为广泛，我们*常说的Web服务器指的是网站服务器，它是建立在Internet之上并且驻留在某种计算机上的程序。Web服务器可以向Web客户端(如浏览器)提供文档或其他服务，只要是遵循HTTP协议而设计的网络应用程序都可以是Web客户端。

Web服务器和HTTP服务器可以说是同一个东西，当然非得细分的话，HTTP服务器是建立在HTTP协议之上的提供文档浏览的服务器，更多的是提供静态的文件。而Web服务器涵盖了HTTP服务器(这一点可以自行百度百科), Web服务器不仅能够存储信息，还能在用户通过Web浏览器提供的信息的基础上运行脚本和程序。
Web服务器约等于 HTTP服务器 + 其他服务

目前所熟知的Web服务器有很多，其*主流的是 Apache, Nginx, IIS
各大Web服务器的实现细节都不同，是为了某种情形而设计开发的。但是它们的基础工作原理是相同的，这也是本次基础篇所讲解的内容。

一、Web服务器工作原理图解
%title插图%num

首先我们暂时不考虑HTTP协议的各种请求方式，我们先跟着**（Web服务器工作原理总体描述01）这张图，将一次Web服务的工作流程过一遍，我们假设以浏览器作为客户端
(1) 用户做出了一个操作，可以是填写网址敲回车，可以是点击链接，可以是点击按键等，接着浏览器获取了该事件。
(2) 浏览器与对端服务程序建立TCP连接。
(3) 浏览器将用户的事件按照HTTP协议格式**打包成一个数据包，其实质就是在待发送缓冲区中的一段有着HTTP协议格式的字节流。
(4) 浏览器确认对端可写，并将该数据包推入Internet，该包经过网络*终递交到对端服务程序。
(5) 服务端程序拿到该数据包后，同样以HTTP协议格式解包，然后解析客户端的意图。
(6) 得知客户端意图后，进行分类处理，或是提供某种文件、或是处理数据。
(7) 将结果装入缓冲区，或是HTML文件、或是一张图片等。
(8) 按照HTTP协议格式将(7)中的数据打包
(9) 服务器确认对端可写，并将该数据包推入Internet，该包经过网络*终递交到客户端。
(10) 浏览器拿到包后，以HTTP协议格式解包，然后解析数据，假设是HTML文件。
(11) 浏览器将HTML文件展示在页面
以上为Web服务器工作基本原理。其实不难发现，这仅仅只是一个简单的网络通信。我们应该深信，作为一个服务器，其根本的工作无非有三个

接收数据 2. 发送数据 3. 数据处理
而Web服务器的本质就是接收数据 ⇒ HTTP解析 ⇒ 逻辑处理 ⇒ HTTP封包 ⇒ 发送数据
高级的服务器无非就是将这三个部分更加细致的设计了。
二、Web服务器之提供静态文件工作原理图解
Web服务器*主要的功能是提供静态的文件。日常的上网浏览大多是网页浏览，少数时候才会有一些数据的提交操作。因此，我们结合上一张图示来重点讲解在GET请求下的Web服务器工作原理。

%title插图%num

其他流程基本不变，着重在于红色与蓝色部分。
(1) 当用户点击一个网页链接或浏览器加载一些资源(css,jpg …)时产生。
(6) 服务程序解包后，确定其为GET请求，并且是对该服务器上的某一资源的请求。首先服务程序会去确认该路径是否存在，再确定该路径的文件是否可以获取。
(7-1) 如果请求的路径有误，或者该资源不能被用户获取，则返回错误提示页面。很多服务器的错误页面只有404，更专业的应该是将错误分类并返回对应的错误代码页面。
(7-2) 如果该路径合法且文件可以被获取，那么服务程序将根据该文件类型进行不同的装载过程，记录其类型作为(8)中HTTP协议中对应的返回类型，并加入响应头。

假设以点击一个页面链接为例，浏览器首先将HTML文件请求过来，再以同样的流程对HTML文件中包含的资源文件路径进行依次请求。

%title插图%num

三、Web服务器之数据提交工作原理图解
仅仅只是网页的浏览并不能满足所有人的需求，客户端与服务器应当是有数据交互的。
即使单方面的资源请求任然是网络的主力军。
我们应该清楚的知道，数据提交对于用户来说有什么作用。
(1) 资源上传 (2) 登陆验证 (3) API接口调用 (4) 远程指令等
数据提交使得用户的操作性有了质的飞跃，它使得HTTP短连接获取静态文件的方式提升到了动态交互的层次上。该性质也催化出各式各样的编程语言、框架。例如PHP，JavaWeb。
如果你留意目前主流的那些大型服务器，你会发现再高级再牛逼的东西实际是也是*基础的东西建造的。那么我们还可以顺便学习一下*古老的动态技术CGI
%title插图%num

其他流程基本不变，着重在于红色与蓝色部分。
(1) 用户提交数据，假设用户点击一个按键提交填好的信息。在(3)中将以POST格式写入，并填入提交至服务端的可执行程序的路径。
(6) 服务端将参数与该CGI绑定，复制进程，用管道传递参数和接收结果
(7) 子进程执行CGI，接收(6)父进程传来的参数，运算完成返回结果。
*后父进程将结果装入静态模板文件，放入缓冲区

四、动态技术
我们得明白，Web服务器是以短连接为主，并且获取的数据到达浏览器的那一刻一定是静态的不变的。那么所谓动态实际是指两种情况

服务端产生：
(1) 用户POST提交数据到某个程序，程序根据该数据作为参数运行，得出结果并装入静态的模板页面中，返回该静态页面。但对于用户来说，同一个页面，做了一个操作后数据不一样了。好了，这就是动态页面。(CGI原理)
(2) PHP的原理是，用户GET请求一个php后缀的文件，服务器先执行该php后缀文件中的PHP代码，将结果填入代码的位置，再返回。当然也可以提交数据参与运算再返回。
客户端产生：
(1) 用户GET请求一个JavaScript文件，服务端不做任何运算返回该静态文件。浏览器收到该JS文件，在本地执行并更新页面。
(2) 用户POST提交数据到服务端，服务端根据该提交的数据指令返回静态文件，浏览器收到后执行并更新。

2025 年 5 月
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31