规范定义了在大多数情况要设置 content-length

在之前介绍 fiddler 使用技巧的文章中，我提到伪造 json 返回响应时，要设置正确的 Content-Length 。

规范定义了在大多数情况要设置 Content-Length ，只有少数情况例外。在浏览器实现上，如果设置了比正确数量要少的 Content-Length ，那么内容会被截断，若比正确数量要多，那么会一直处在等待加载更多内容的状态。

之前也提到过，如果伪造的 json 中只有英文和数字，选中它们后，编辑器上显示选中多少字符， Content-Length 就设为多少。如果 json 中还有中文，那么一个中文字符就要当成三个英文字母来计算。

为什么是这样？

首先从规范中摘取 Content-Length 部分定义：

上面的 OCTET 指的是，任意连续的八比特数据，可以近似理解为一个字节。

也就是说 Content-Length 指的是响应 body 的字节长度，而不是字符串长度。

同一个字符，在不同的编码规则下，有可能会有不同的字节长度。比如下面展示的大写字母 “A” 的情况：

在 UTF-8 变长编码方式下，英文和数字用一字节编码，绝大部分汉字用三字节编码。这就是为什么一个中文字符要当成三个英文字母。

如果你很不幸像我一样要经常计算带有中文的 Content-Length ，可以尝试用 javascript 代码帮你计算字符串的字节长度：

javascript 用的是 Unicode 字符集，上面的代码用 charCodeAt 获取字符的 Unicode 编码值，然后根据值所在的区间和 Unicode 与 UTF-8 的对应关系，推算字节数。