第3章 HTTP报文内的HTTP信息

HTTP报文大致分为报文首部和报文主体两块。两者通过空行(CR+LF)来划分。

1.jpeg

编码提升传输速率

报文主体和实体的差异

  • 报文 (message)
    是HTTP通信中的基本单位,由8位组字节流(octet sequence, 其中octet为8个比特)组成,通过HTTP通信传输。

  • 实体(Entity)
    作为请求或响应的有效载荷数据被传输,其内容由实体首部和实体主体组成。

通常报文主体等与实体,只有当传输中进行编码操作时,实体的内容发生变化,才导致它和报文主体产生差异。

压缩传输的内容编码

内容编码指应用在实体内容上的编码格式,并保持实体信息原样压缩。内容编码后的实体由客户端接收并负责解码。

常见的内容编码:

  • gzip (GNU zip)
  • compress (UNIX系统的标准压缩)
  • deflate (zlib)
  • identity (不进行编码)

分割发送的分块

在传输大容量数据时,通过把数据分割成多块,能够让浏览器逐步显示页面。

这种把实体主体分块的功能称为分块传输编码(chunked transfer coding)。

发送多种数据的多部分对象集合

多部分对象集合包含的对象如下:

  • multipart/form-data
    在Web表单文件上传时使用
2.jpeg
  • multiparty/byteranges
    状态码206(Partial Content)响应报文包含了多个范围的内容时使用。
3.jpeg

4.jpeg

在HTTP报文中使用多部分对象集合时,需要在首部字段加上Content-type。

使用boundary字符串来划分多部分对象集合指明的各类实体。在boundary字符串指定的各个实体的起始行之前插入“--”标记(如:--AaB03x),而在多部分对象集合对应的字符串的最后插入“--”标记作为结束(例如:--AaB03x--)。

获取部分内容的范围请求

使用首部字段Range来指定资源的byte范围。
形式如下:

  • 5001-10000字节
Range: bytes=5001-10000
  • 5001之后的全部字节
Range: bytes=5001-
  • 从一开始到3000字节和5000-7000字节的多重范围
Range:  bytes=-3000, bytes=5000-7000

针对范围请求,响应回返回状态码206Partial Content的响应报文。另外对于多重范围的范围请求,响应会在首部字段Content-Type标明multiparty/byteranges后返回响应报文。

如果服务器无法响应范围请求,则会返回状态码200 OK和完整的实体内容。

内容协商返回最合适的内容

当浏览器的默认语言为英语或中文时,访问相同的URI的Web页面时,则会显示对应的英文版或中文版Web页面。这样的机制称为内容协商(content negoation)。

包含在请求报文中的某些首部字段就是判断的基准:

  • Accept
  • Accept-Charset
  • Accept-Encoding
  • Accept-Language
  • Content-Language

推荐阅读更多精彩内容