Unicode(中文:万国码、国际码、统一码、单一码)是电脑科学领域里的一项业界标准。它对世界上大部分的文字系统进行了整理、编码,使得电脑可以用更为简单的方式来呈现和处理文字。
Unicode 伴随着通用字元集的标准而发展,同时也以书本的形式对外发表。Unicode 至今仍在不断增修,每个新版本都加入更多新的字元。目前最新的版本为 2019 年 5 月公布的 12.1.0,已经收录超过13万个字元(第十万个字元在 2005 年获采纳)。Unicode 涵盖的资料除了视觉上的字形、编码方法、标准的字元编码外,还包含了字元特性,如大小写字母。
Unicode 发展由非营利机构统一码联盟负责,该机构致力于让 Unicode 方案取代既有的字元编码方案。因为既有的方案往往空间非常有限,亦不适用于多语环境。
Unicode 备受认可,并广泛地应用于电脑软件的国际化与在地化过程。有很多新科技,如可延伸标示语言(Extensible Markup Language,简称:XML)、Java 程式语言以及现代的操作系统,都采用 Unicode 编码。
版权声明: 本部落格所有文章除特别声明外,均采用 CC BY-NC-ND 4.0 许可协议。转载请注明来自 我不会写程式!