gb2312
中文windows系统默认的是gb2312,文件内码也是gb2312的。变更为utf-8后,相应文本格式的文件内码也需要转换成utf-8才可以被当作正常编码读取。主要是由于gb2312并不是utf-8编码集的子集
五笔输入法86版是一款非常经典的电脑文字输入法。五笔输入法86版拥有庞大的五笔词组库,而且与系统兼容性非常好所以运行很稳定,是非常适合用户学习工作时使用的一款输入法软件。 五笔输入法86版由五项专利、五种编码输入法构成,同一科学体系,由初级到高级,一脉相承、五级递进,并与五笔字型巧妙链接,均可输入单字和词汇
给博客搬家后发现wordpress后台多媒体中上传图片时不能用带中文的文件名,否则穿完后会出现红叉,访问生成的URL会出404! 记得之前在Dreamhost上是没有任何问题的,研究了一番后问题是这样出现的:WP的php脚本使用的字符编码是UTF-8,所以上传后生成的文件名字符串也是UTF-8编码的,而主机系统的设置应该是ANSI的(GB2312或GBK之类的),所以导致请求文件名编码与实际文件编码不一致,导致404错误。而之前搬家时搬过来的以前上传的文件没有问题,就是在主机控制面板上的webftp里看到的都是作为ANSI解析的UTF-8字节乱码,而后来上传的图片文件虽然用浏览器访问会404,但在webftp里看着却一切正常,这该死的字符编码问题!
逍遥笔手写识别输入是一款免费手写输入软件。软件集手写识别、全屏手写、数字墨水、汉字拼音、词语联想等多种功能于一身。拥有自主研发的手写识别引擎,应用了独创的数字墨水技术,具有识别率高,识别数速快、资源占用率低,运行效率高、操作人性化等优点
先跟我做个实验:如果你用的是中文windows,运行记事本,输入“联通”两个字不要带引号,任取文件名保存,再打开,你会发现联通消失了,留下一个小方块。 拿这个例子来解释utf-8真是形象生动——因为记事本保存一份新建文档时的默认编码为ANSI,中文windows下就是GB2312,“联通”按GB2312保存为4个字节,头三个字节凑巧为utf-8编码文档开头的特征码byte order mark(BOM),所以记事本再次打开这个文件时,认定该文档是经utf-8编码,于是直接显示了第4个字节,那就是个小方块。 我不是第一个做这个实验的人,不过我跟开这个玩笑的人有着同样的感觉:联通确实不是个好名字,永远不能起头,所以永远被移动压着打
高举中国特色社会主义旗帜,深入学习贯彻党的十八大精神,以***理论、“****”重要思想和科学发展观为指导,以***总书记提出的“中国梦”为方向,围绕航空装备维修工程学院“我阳光,我健康”的主题活动,通过“用青春点燃正能量,用阳光编织新梦想”系列征文活动,引导学生树立正确的世界观、人生观、价值观。 文字,是水;文字,是阳光;文字,滋润着我们的生命;文字,吐露着我们的点滴心声。以“用青春点燃正能量,用阳光编织新梦想”为主题,围绕航修系统的新梦想,围绕长沙航院的快速发展,围绕学习、生活中的阳光事迹,引导学生讲述自己亲历亲见的“中国梦”、“航院梦”与个人的航修梦,用文章记录和表达爱国之心、爱校之心与青春之心
首尔市为广泛使用首尔的固有字体,提升城市认同性与品牌价值而开发出明体系列的4种首尔汉江体(Light、Medium、Bold、Extra Bold)和哥特体系列的4种首尔南山体(Light、Medium、Bold、Extra Bold)、1种竖写体等共9种首尔字体。 首尔字体中蕴含着强韧的儒生精神与端庄的余白美,从造型上展现了韩屋的开放和瓦片的曲线美。此外,首尔字体取名时采用首尔两大代表性资源“汉江”和“南山”,更能激发市民对韩民族固有美丽语言——韩文的文化自豪感
最近在做一个程序,需要用到iconv函数把抓取来过的utf-8编码的页面转成gb2312, 发现只有用iconv函数把抓取过来的数据一转码数据就会无缘无故的少一些。 让我郁闷了好一会儿,去网上一查资料才知道这是iconv函数的一个bug。iconv在转换字符"—"到gb2312时会出错 以下为引用的内容: ignore的意思是忽略转换时的错误,如果没有ignore参数,所有该字符后面的字符串都无法被保存
下图展示了不同编解码器对“A”和高音谱号等字符编码后得到的字节 序列。注意,后 3 种是可变长度的多字节编码。 图 中的星号表明,某些编码(如 ASCII 和多字节的 GB2312)不能 表示所有 Unicode 字符
2007年的时候,使用MySql5.5.x版本,发现一个问题:对于varchar字段(char估计一样),在选择utf8字符集时(后面新出来的utf8mb4一样),无法按中文拼音排序,即:排序规则中没有gbk_chinese_ci一项,而在选择gbk、gb2312、gb18030都有,这个问题一直没有找(想)到答案,因为后面的工作中使用SQL Server和Oracle居多。 今天再次出现这个问题,在网上找一遍资料后,回忆起当年的来龙去脉,逐渐想明白了其中原因:如果是选择中文字符集,比如GBK,那么数据库排序规则原则上只会考虑拉丁文和中文字符存在的可能,所以可以有中文排序规则可选;但是如果选择utf8等大的字符合集时,除了中文,还有其他语言字符存在,假如选择排序规则为中文拼音的话,其他语言字符如何排序呢?