查看: 1406|回复: 1
|
GBK比CJK 20902统一汉字多出101字
[复制链接]
|
|
GBK规范收录了ISO 10646.1/Unicode 1.0-1992中的全部CJK汉字和符号,并有所补充。具体包括:
1. GB 2312中的全部汉字、非汉字符号。
2. GB 13000.1中的其他CJK汉字。以上合计20902个GB化汉字。
3. 《简化字总表》中未收入GB 13000.1的52个汉字。
4. 《康熙字典》及《辞海》中未收入GB 13000.1的28个部首及重要构件。
5. 13个汉字结构符。
6. BIG-5中未被GB 2312收入、但存在于GB 13000.1中的139个图形符号。
7. GB 12345增补的6个拼音符号。
8. 汉字“○”。
9. GB 12345增补的19个竖排标点符号(GB 12345较GB 2312增补竖排标点符号29个,其中10个未被GB 13000.1收入,故GBK亦不收)。
10. 从GB 13000.1的CJK兼容区挑选出的21个汉字。
11. GB 13000.1收入的31个IBM OS/2专用符号。
按上面的一些数字加起来(不计符号):
1. GB 13000.1中的CJK汉字20902个 。
2. 简化字总表中未收入GB 13000.1的汉字52个。
3. 康熙字典及辞海中未收入GB 13000.1的28个部首及重要构件。
4. 从GB 13000.1的CJK兼容区挑选出的汉字21个。
20902+52+28+21=21003个(如果包含汉字“○” 21004个)
从附件的系统工具打开字符影射表(Accessories > System Tools > Character Map),选择“宋体”(SimSun),选中高级查看(Advanced view),选择分组(Group by)中的“Unicode分区”(Unicode subrange),从Unicode分区中选择专用字符(Private Use Characters),即可发现上述52个汉字和28个偏旁部首,另有一个欧元符、10个竖排标点、2个拼音和13个汉字结构符。 |
|
|
|
|
|
|
|

楼主 |
发表于 12-10-2005 03:43 PM
|
显示全部楼层
52个简化字总表中未收入GB 13000.1的汉字:
㑳㑇㖞㘚㘎㥮㤘㧏㧟㩳㧐㭎㱮㳠䁖䅟䌷䎱䎬䏝䓖䙡䙌䜣䜩䝼䞍䥇䥺䥽䦂䦃䦅䦆䦟䦛䦷䦶䲣䲟䲠䲡䱷䲢䴓䴔䴕䴖䴗䴘䴙䶮
28个康熙字典及辞海中未收入GB 13000.1的部首及重要构件:⺁⺄⺈⺋⺌⺗⺧⺪⺮⺳⺶⺷⺻⻊
21个从GB 13000.1的CJK兼容区挑选出的汉字:
郎凉秊裏隣兀嗀﨎﨏﨑﨓﨔礼﨟蘒﨡﨣﨤﨧﨨﨩 |
|
|
|
|
|
|
| |
本周最热论坛帖子
|