他们的目标是用其标准的 Unicode 转换格式(UTF)替换现有的字符集。

Unicode 标准已经获得成功,并通过 HTML、XML、Java、JavaScript、电子邮件、ASP、PHP 等得以实现。在许多操作系统和所有现代浏览器中,同样支持 Unicode 标准。

Unicode 联盟与领先的标准开发组织(例如 ISO、W3C 和 ECMA)开展合作。

Unicode 可以通过不同的字符集实现。最常用的编码是 UTF-8 和 UTF-16:

UTF-8 可以表示 Unicode 标准中的任何字符。

16 位 Unicode 转换格式是 Unicode 的可变长度字符编码,能够对整个 Unicode repertoire 进行编码。

由于 ISO-8859 中的字符集大小受限制,并且不兼容多语言环境,因此 Unicode 联盟开发了 Unicode 标准。

Unicode 标准(几乎)涵盖了世界上所有的字符、标点符号和符号。

Unicode 支持独立于平台和语言的文本处理、存储和传输。

HTML5 中的默认字符编码为 UTF-8。

如果 HTML5 网页使用的字符集与 UTF-8 不同,则应在 标记中指定该字符集,例如:

编码是将这些数字转换为二进制数字以存储在计算机中的方式:

编码将数字转换为二进制。字符集将字符转换为数字。

下表是 HTML5 支持的一些 UTF-8 字符代码的列表: