下图展示了不同编解码器对“A”和高音谱号等字符编码后得到的字节 序列。注意,后 3 种是可变长度的多字节编码。

图 中的星号表明,某些编码(如 ASCII 和多字节的 GB2312)不能 表示所有 Unicode 字符。然而,UTF 编码的设计目的就是处理每一个 Unicode 码位。

cp437 IBM PC 最初的字符集,包含框图符号。与后来出现的 latin1 不兼容。

gb2312 用于编码简体中文的陈旧标准;这是亚洲语言中使用较广泛的多字节编码之一。

流畅的Python(2017年人民邮电出版社出版)