jianhong_wu 发表于 2017-5-29 12:27:45

为什么很多面对汉字机内码的翻译,很多C编译器都容易存在bug而误译?已解答。

本帖最后由 jianhong_wu 于 2017-5-29 12:28 编辑

坚鸿-深圳:
其实,很多C编译器对中文的汉字机内码的翻译都容易存在bug,其中某版本的C51的bug最多,记得上回遇到“数”这个字就明显翻译出错。后来还遇到过对32位单片机的某版本的ARM_MDK编译器对“步”这个汉字翻译也会出错。为什么大多数C编译器容易犯这个错误呢?我来谈谈我的观点。我以前做过编辑器这类项目开发,所以略懂一二,如果“汉字,字符,数值”三者混在一起的时候,在识别上,算法上是需要额外增加很多判断的,所以很多C编译器都一不小心就容易会犯的bug。

hippo-深圳:
本地ANSI编码是GBK易出问题,如果是unicode还好。字符集,最开始的128个ASCII,到扩展欧洲字符的256个ASCII,中国搞一个GB2312/GBK,后面国际标准化组织搞unicode。。。

坚鸿-深圳:
因此,是很为难搞C编译器开发的兄弟。是挺考验C编译器开发者的。

页: [1]
查看完整版本: 为什么很多面对汉字机内码的翻译,很多C编译器都容易存在bug而误译?已解答。