unicode
Python变量的命名常称作标识符,规则包括: 长度任意长; 标识符不能与保留关键字同名;可以用keyword模块查看保留关键字。实例代码如下: Python2.x中,标识符以ASCII的字母或下划线开始,后面可以接字母、数字、下划线;在Python3.x中,标识符ASCII字母、下划线以及大多数非英文语言的字母,只要是Unicode编码的字母都可以充当引导字符,后续字符可以是任意引导符,或任意非空格字符,包括Unicode编码中认为是数字的任意字符。(因此可以使用阿拉伯语、中文、日语或俄语字符或Unicode字符集支持的任意其他语言中的字符进行命名) Python对大小写敏感,因此Var与var表示两个不同的变量名
如果你用一般的文字编辑器阅览这份文件 请忽略文中奇特的注记字符. 这份文件是以 POD (简明文件格式) 写成; 这种格式是为了能让人直接读取 而特别设计的. 关于此格式的进一步资讯 请参考 perlpod 线上文件. Perl 本身以 Unicode 进行操作. 这表示 Perl 内部的字串资料可用 Unicode 表示; Perl 的函式与算符 (例如正规表示式比对) 也能对 Unicode 进行操作. 在输入及输出时 为了处理以 Unicode 之前的编码方式储存的资料 Perl 提供了 Encode 这个模组 可以让你轻易地读取及写入旧有的编码资料. cp950 字码页 950 (Big5 + 微软添加的字符) 另外,若程式码本身以 utf8 编码储存,配合使用 utf8 模组,可让程式码中字串以及其运 算皆以字符为单位,而不以位元为单位,如下所示:
一般常见的压缩档格式 (以 Windows 平台来说) 大致上就是 zip、7z、rar ,rar 算是在费时以及压缩比来讲最具经济效益的一种格式,因为格式本身有专利、压缩的功能本身是付费授权,且 Win ME 以后 Windows 系统已经内建了 zip 的压缩、解压缩功能(虽然是有够阳春),不需要安装额外的软件,在 Windows 平台上公开交换档案来说,zip 仍旧是一种非常常见的压缩格式。 zip 毕竟是比较古老的格式(当然后面有出了改良后的版本 zipx、但一直没有普及),最为人诟病的地方大概就是压缩率非常的差劲(且不支援unicode档名),自己手边的档案随便抓一些压缩后做比较,发现 zip 很容易就比 rar 或 7z 多占 50% 左右的空间 (当然还是要看里面的档案格式而定)。 一般压缩软件在压缩档案的时候大多只会提供使用者选择压缩档的格式,但并不会提供压缩算法的选择,而 7-zip 刚好有提供这样的选项,于是就用 7-zip 来压缩 zip 做个比较
存储中文,字段是varchar,为什么不是nvarchar? varchar 在SQL Server中是采用单字节来存储数据,nvarchar是使用Unicode来存储数据。中文字符存储到SQL Server中会保存为两个字节(一般采用Unicode编码),英文字符保存到数据库中,如果字段的类型为varchar,则只会占用一个字节,而如果字段的类型为nvarchar,则会占用两个字节。 正常情况下,我们使用varchar也可以存储中文字符,但是如果遇到操作系统是英文操作系统并且对中文字体的支持不全面时,在SQL Server存储中文字符为varchar就会出现乱码(显示为??)
什么是UTF? 答:在程序读写数据时,会用到UTF(Unicode Text Format)标准的代码, UTF的格式如下: ①对7位的ASCll码,UTF将其写成一字节,且最高位为0,即: ②对带5位0的16位字符(实际上只有11位),UTF用两个字节表示,且高字节以 110开始,低字节以10开始,110和10实际上作为前缀,即: ③对其他代码,UTF全用三字节表示,并且三个字节分别用11101010作为前缀。即: UTF采用这种编码格式的优点是扩大了代码容量,而ASCII码仍用单字节表示,这样可与大量采用ASCII码的文本保持兼容。但另一方面,对于亚洲语言来说,UTF并不是太好,因为亚洲语言文字采用双字节表示,而UTF没有相应的支持办法,所以只能用三字节表示
历史上 有两个独立的 创立单一字符集的尝试. 一个是国际标准化组织(ISO)的 ISO 10646 项目 另一个是由(一开始大多是美国的)多语言软件制造商组成的协会组织的 Unicode 项目. 幸运的是 1991年前后 两个项目的参与者都认识到 世界不需要两个不同的单一字符集. 它们合并双方的工作成果 并为创立一个单一编码表而协同工作. 两个项目仍都存在并独立地公布各自的标准 但 Unicode 协会和 ISO/IEC JTC1/SC2 都同意保持 Unicode 和 ISO 10646 标准的码表兼容 并紧密地共同调整任何未来的扩展.
中文字符集有哪些?它们又有什么区别呢?过去咱们对于中文字符集中的几个编码方式的区别分的不是很清楚,过去我也一直以为 GB2312 就是 GBK 呢。原来啊,他们还是有区别的,最大的区别就是包含的汉字数量不一样。当然在常用字方面,你可以认为用 GB2312 就足够了
Swift 是一种支持多编程范式和编译式的开源编程语言苹果于2014年WWDC(苹果开发者大会)发布,用于开发 iOS,OS X 和 watchOS 应用程序。 Swift 的字符是一个单一的字符字符串字面量,数据类型为 Character。 如果你想在 Character(字符) 类型的常量中存储更多的字符,则程序执行会报错,如下所示: Swift 中不能创建空的 Character(字符) 类型变量或常量: Swift 的 String 类型表示特定序列的 Character(字符) 类型值的集合
刚开始开发时,Python只支持ascii编码,在Python2.1时Unicode文本只能用 Latin-1编码来绕过Unicode编码,使得对于亚洲国家的开发者来说很不友好; 解决方法是指定每个源文件的编码:在文件的第一行或者第二行用一个特殊的注释来指明文件的编码;注释必须满足如下正则表达式: 其中捕获组中的值就是编码,必须是有效的编码,否则将在编译期报错。编码必须是ASCII兼容超集的,如 utf-8,像 utf-16 这种所有字符都是2字节以上的就不行,这是有Python解释器决定的。同时这个注释也用来给编辑器提供编码提示,如:Vim 和 Emacs
属性文件乱码通常是中文乱码,在英文下通常没有这个问题。 如上图显示的,中文字符在属性文件中读取后会显示为乱码. 导致这个问题的主要原因是属性文件如果你不进行设置,那么将会默认使用 ISO-8859-1 字符集来存储的。 通常我们也不建议在属性文件中过多使用中文,一般来说属性文件都是一些配置,如果需要中文的配置可以存储在其他的文件中
