| 发表于:2008-01-20 06:02:101楼 得分:0 |
你把字符编码与字符集混为一谈了。 编码实际上是指ascii、unicode、mbcs、utf-8等概念,windows2000以后的缺省编码是unicode,与是否中文版/英文版无关;系统内部也支持 ascii(英文就是有优先),但使用的api是另外一套;其他的要经过转换。 字符集是另外一回事,它是单一语言的一个编码子集(甚至不是完整的),它与另一个概念密切相关:代码页(codepage)。系统通过cp将非英文的其他字符映射到unicode空间里。简体中文xp缺省代码页是cp936,本身已经支持gb18030(这是一个强制执行的国家标准),gbk是gb18030的特例,只支持到两个字节(gb18030可以到4个字节,不过通常不会用到,只是留下扩展余地,就好像unicode大部分情况是指unicode-16,实际上unicode-32也确实存在),但一般情况下把gbk看做是gb18030也问题不大。 | | |
|