VC/MFC
VB
Delphi
C++ Builder
C/C++
Java
.NET技术
MS-SQL Server
PowerBuilder
DB2
Oracle
Web 开发
Linux/Unix社区
硬件/嵌入开发
移动平台
您的位置:
程序门
->
vc/mfc
-> 基础类
请教一下怎么才能在unicode字符中判断里面的字是汉字
[
收藏此页
] [
打印本页
]选择字色:
默认
灰色
红色
黄色
绿色
橙色
紫色
蓝色
褐色
墨绿
深蓝
赭石
粉绿
淡绿
黄灰
翠绿
综红
砖红
淡蓝
暗红
玫瑰红
紫红
桔黄
军黄
烟灰
深灰
灰蓝
背景色:
默认
黑色
红色
黄色
绿色
橙色
紫色
蓝色
褐色
墨绿
深蓝
赭石
粉绿
淡绿
黄灰
翠绿
综红
砖红
淡蓝
暗红
玫瑰红
紫红
桔黄
军黄
烟灰
深灰
灰蓝
字体:[
大
][
中
][
小
]
请教一下怎么才能在unicode字符中判断里面的字是汉字
[已结贴,结贴人:hopewzy1982]
发表于:
2007-04-11 17:05:44
楼主
wchar_t* szbuff;
.....
我的 szbuff从文件中读取了字符后,要怎么才能判断里面的每一个字符是汉字还是非汉字的呀,unicode中汉字的范围是多少呀,请教一下各位高手,谢谢了呀
发表于:
2007-04-11 17:15:26
1
楼 得分:
5
中日韩文字在一张表里,你无法判断是汉字还是日本文字.
http://www.chi2ko.com/tool/cjk.htm可以看一下
发表于:
2007-04-11 17:17:11
2
楼 得分:
0
> 127
发表于:
2007-04-11 17:44:21
3
楼 得分:
0
请问什么值大于127,其实是我想从一个纯unicode符的文件中取出里面的内容,然后转变成多字符集存放在另一个文件中,其中的"汉字"要变成gb的,其它的变成 "s-jis "我现在只能把它们变成纯s-jis或gb
发表于:
2007-04-11 17:50:11
4
楼 得分:
5
http://community.csdn.net/expert/topic/5453/5453933.xml?temp=.2129938
发表于:
2007-04-11 20:28:05
5
楼 得分:
0
如果是ansi,有个函数可以判断;
如果是unicode,非汉字后一个字节是0;
用ultraedit打开看。
说错了请楼下更正。:)
发表于:
2007-04-11 20:28:29
6
楼 得分:
5
unicode 字符由两个字节组成,如果是标准的ansi字符,高位字节就为0,低位字节为对应的字符编码.也就是说实际上它只用到了一个字节;
而如果是汉字的话,则两个字节都给使用了,并且每个字节中的值都会> 127;
所以,对于如何判断所输入的是不是汉字,可以根据查看高位字节来确定,如果高位字节为00则不是,如果高位字节> 127则是汉字.
我就是用这个方法来确定的,不过没有根据,有更好的方法的话,告诉我一下.
发表于:
2007-04-11 20:30:17
7
楼 得分:
0
或者把每个unicode字符强制转换成short类型,汉字一定大于255.
发表于:
2007-04-11 20:47:38
8
楼 得分:
5
中日韩等东亚文字的unicode编码都大于255.
我记得每个语言的unicdoe编码对应了一个范围,只要判断是否在这个范围就可以了.
具体上网搜一下吧.
发表于:
2007-04-12 13:47:12
9
楼 得分:
0
我在网上看到有下面的资料:
因为fontrouter新版本开发的需要,在网上搜索了一下汉字的unicode范围,普遍给出了“u+4e00..u+9fa5”。但事实上这个范围是不完整的,甚至连基本的全角(中文)标点也未包含在内。为此,我特地查询了unicode官方的code charts数据库,并根据最新的unicode 5.0版整理如下:
注:在绝大多数应用场合中,我们可以仅用(1)、(2)、(3)、(4)的集合作为cjk判断的依据。
1)标准cjk文字
http://www.unicode.org/public/unidata/unihan.html
code point range block name release
u+3400..u+4db5 cjk unified ideographs extension a 3.0
u+4e00..u+9fa5 cjk unified ideographs 1.1
u+9fa6..u+9fbb cjk unified ideographs 4.1
u+f900..u+fa2d cjk compatibility ideographs 1.1
u+fa30..u+fa6a cjk compatibility ideographs 3.2
u+fa70..u+fad9 cjk compatibility ideographs 4.1
u+20000..u+2a6d6 cjk unified ideographs extension b 3.1
u+2f800..u+2fa1d cjk compatibility supplement 3.1
2)全角ascii、全角中英文标点、半宽片假名、半宽平假名、半宽韩文字母:ff00-ffef
http://www.unicode.org/charts/pdf/uff00.pdf
3)cjk部首补充:2e80-2eff
http://www.unicode.org/charts/pdf/u2e80.pdf
4)cjk笔划:31c0-31ef
http://www.unicode.org/charts/pdf/u31c0.pdf
5)康熙部首:2f00-2fdf
http://www.unicode.org/charts/pdf/u2f00.pdf
6)汉字结构描述字符:2ff0-2fff
http://www.unicode.org/charts/pdf/u2ff0.pdf
7)注音符号:3100-312f
http://www.unicode.org/charts/pdf/u3100.pdf
8)注音符号(闽南语、客家语扩展):31a0-31bf
http://www.unicode.org/charts/pdf/u31a0.pdf
9)日文平假名:3040-309f
http://www.unicode.org/charts/pdf/u3040.pdf
10)日文片假名:30a0-30ff
http://www.unicode.org/charts/pdf/u30a0.pdf
11)日文片假名拼音扩展:31f0-31ff
http://www.unicode.org/charts/pdf/u31f0.pdf
12)韩文拼音:ac00-d7af
http://www.unicode.org/charts/pdf/uac00.pdf
13)韩文字母:1100-11ff
http://www.unicode.org/charts/pdf/u1100.pdf
14)韩文兼容字母:3130-318f
http://www.unicode.org/charts/pdf/u3130.pdf
15)太玄经符号:1d300-1d35f
http://www.unicode.org/charts/pdf/u1d300.pdf
16)易经六十四卦象:4dc0-4dff
http://www.unicode.org/charts/pdf/u4dc0.pdf
17)彝文音节:a000-a48f
http://www.unicode.org/charts/pdf/ua000.pdf
18)彝文部首:a490-a4cf
http://www.unicode.org/charts/pdf/ua490.pdf
19)盲文符号:2800-28ff
http://www.unicode.org/charts/pdf/u2800.pdf
20)cjk字母及月份:3200-32ff
http://www.unicode.org/charts/pdf/u3200.pdf
21)cjk特殊符号(日期合并):3300-33ff
http://www.unicode.org/charts/pdf/u3300.pdf
22)装饰符号(非cjk专用):2700-27bf
http://www.unicode.org/charts/pdf/u2700.pdf
23)杂项符号(非cjk专用):2600-26ff
http://www.unicode.org/charts/pdf/u2600.pdf
但我还想请教一下,1)里面的 "u+3400 ", "u+2a6d6 "中的 "u+ "和 "u+2 "指的是什么呀
发表于:
2007-04-12 13:55:00
10
楼 得分:
0
u+3400就是16进制数3400, u+2a6d6就是16进制数2a6d6,明白?
发表于:
2007-04-12 13:56:14
11
楼 得分:
0
顶,我最近在做一个程序,里面也要识别输入的,长见识
发表于:
2007-04-12 16:14:10
12
楼 得分:
0
明白了,谢谢了呀
发表于:
2007-04-12 19:18:46
13
楼 得分:
0
唉,是我说错了,我是想把简体汉字给区分出来,不知道大家只不知道范围
发表于:
2007-04-12 21:04:02
14
楼 得分:
5
这个容易啊,你可以先把unicode码转换成gb2312,然后在gb2312里面判断,这样就解决了啊
发表于:
2007-04-13 09:31:52
15
楼 得分:
0
但我是要把unicode里的简体汉字转换成gb,日语里的汉字转换成jis呀,而且是jis的文字占大部份,我还想请教一下jis的范围呀
发表于:
2007-04-13 11:19:27
16
楼 得分:
5
中日都是交杂在一起的,有的是相同的
下一篇:
excel中有些不能输入字符,读到这些字符时,在字符串中显示“?”,怎么处理?
上一篇:
大虾们 请介绍一些学习面向对象编程 和软件设计 的书籍,谢谢了
相关文章
枚举本进程内所有线程,并获得handle,能想到几种...
状态栏上实现弹出式菜单
如何把读入的文本文件在edit控件中显示,先谢了
求助:请各位大哥帮我看看这个字符串处理的问题,...
我利用atl编写一com组件(.exe),想设计一客户端初...
请问想在本窗口成为非活动窗口时做事,该响应什么...
关于波形图的控制与保存的问题
怎么样用vc编写一个客户/服务器端的winsock程序?...
不知咋办
怎么把2维数组作为节点元素放到单链表中去?
急:关于一个在框架类中取得视图类指针的问题?
查询access时theapp指针错误的问题?
我什么程序崩溃
[转] 100分.怎么得到视频文件中的其中一段
很简单的几行代码,但我找不出错误,大家帮我看看吧...
两个createcompatibledc创造的hdc之间可以拷贝吗...
如何在cricheditctrl中插入rtf编码
我做的中国象棋。不要笑我啊。
如何编写一个smtp服务器
在vc中怎么调用java代码
其他资讯
给结构体数组赋初值
关于mfc的小问题,希望有经验的达人们稍微回答一...
头文件pcap.h和stdafx.h的问题
关于取cdbvariant中多条数据的问题
创建了一个c/c++专家群24409991,希望有经验的c/c...
如何通过位图文件直接得到位图大小?
对话框重绘问题
我使用浮点数-1.#ind00为什么保存到access中的数...
关于线程调用的问题
客户机器 不安装oracle客户端 可以实现...
sdk对话框调用web浏览器组件
关于mfc项目中与web应用服务器通讯
同志们啊,怎么打印edit里面的一大段文字啊???
我这样用的时间多吗
求思路???
求rsa1024加解密的源码,vc6的,谢了!!
显示树状列表
在listctrl中输入文本
拜求:实现xmodem协议的串口通信,
access 数据库如何取得某一列的合???
快速检索
分类导航标签a
软件培训/认证/考试IBM
Web 开发CGI
企业开发地理信息系统
.NET技术图表区
多媒体/设计/Flash/Silverlight 开发Silverlight
其他数据库开发数据仓库
《程序员》杂志购买/订阅/渠道
多媒体/设计/Flash/Silverlight 开发Silverlight
其他数据库开发其他
软件工程/管理开发方法版
软件工程/管理开发过程版
扩充话题IT传闻
PowerBuilder控件与界面
Windows专区网络管理配置和工具使用
VBVBA
最新资讯
随即数
寻找j2ee方面兼职的活儿~~
上周五面 baidu 的题, 60 ...
代码设置横向打印为何不对??
ws返回类型
求助][算法]巧移黑白子问题!
怎样制作一个类似任务栏的窗口
vista能多用户同时登录吗
在学习谭浩强编的《c++面向对象程序设计》过程中...
正则表达式的问题
进来就有分!!!
sql*load导入大批数据的问题
duwamish 7.0问题,请高手帮忙解惑
mfc中,想获取消息?请各位大哥帮帮忙
关于动态显示、隐藏控件的问题
请教高人,怎么把记事本里的内容读到一个数组里?...
现在流行100分
datagrid中如何得到最后一行的第一列或某一列的值...
购买网站
sybase有个processes有个进程是“license h...
delphi和matlab混合编程实现曲线平滑效果,可是程...
关于循环中对像名的问题?
新人提问,求前辈指点
没分就没人帮忙吗?真是的..世态严良啊....
ajax中的一个问题
【高手和版主帮忙啊】请教linux移植过程中二进制...
软件工程师上班时都在做什么?
导出数据到csv文件中的问题。
请高手看看触发器问题!!!!!!!!!
转移分,闲人免进
想学控件开发,大虾能否给个小示例
请指教:onpaint 和ondraw 有何具体不...
c# 数据存储类
struts 有日期转换标签吗?
用fileupload实现上传下载的问题
请教关于手动建立ceikedwin控件,只能输入数字的...
求助:excel文档为某块区域设置表边框
为何安装系统时会有如下提示,导致无法安装.请帮忙...
问个在自定义控件中创建自定义事件的问题
请教大虾:dos下运行cl.exe 命令提示:找不...
热门点击
@@@@亟待解决:读写文件摘要的问题!!!!!!!...
activex 中的消息相应顺序和messagebox问题...
水晶报表工具栏的提示信息怎么换成繁体或英文呢?...
怎样更高效利用这资源?
关于那个弹出窗口问题有新进展了
关于 onpaint 函数 界面显示问题...
帮忙用c语言写出单链表插入与删除程序``
刚来北京,有asp.net开发的工作吗?
凭门票进!
关于c#中字符串中英文字符长度截取问题。(紧急呼...
在后台怎么取值(急急急急啊!~~~~~~~~~~~~~~~~~...
ajax简单调用失败!求解······
微软为何要提供更改private字段的方法?
新手求教:swt中如何实现undo/redo
怎样在服务器运行多客户端?
请教大家!急啊!为什么我在myeclipse下调试一个...
关于写pl/sql语句的小问题
如何让程序支持鼠标滚轮?
求一个查询sql或者一个判断查询的语句呀,急
access项目,连接已有的sql2000数据库。但是,任...
bs do熊的进,bs一楼给1分拉
兄弟我真的快哭了!!急求 在线等!!!关于...
java 怎么判断文件夹的读写权限,请高手帮忙...
判断一个字段的值是否为null的sql语句?
出趟小差
请教:关于拷贝构造函数的问题
帮帮我吧 一个关于tablemodell...
real文件去广告是如何实现的?
asp.net数据库连接问题?
iis 使用另一台服务器共享目录问题,在线等,...
eclips开发struts问题
遥感图像的矩形区域保存为另一图像
vcmfc大哥请进
getchar,getche,getch是如何取值的
关于session的问题
一个vc的问题:怎样给命名管道传递第一个参数?
我的jsp管理系统出现下面问题,请高手指导,谢谢...
为什么要这个样子
一个读写内存问题
在datagrid里绑定checkbox后,点checkbox不起作用...