查看: 780|回复: 0
|
[转帖]简化字类推的范围问题 ---
[复制链接]
|
|
简化字类推的范围问题 --- 李先耕
对于运用《简化字总表》第二表“可作简化偏旁用的简化字和简化偏旁”进行类推有无范围,现在有两种意见:一是不设定范围,可以无限类推;二是设定范围,在此范围内类推。笔者是主张第二种观点的,其理由已见于笔者在《求是学刊》2002年第2期的文章(《简化字应否无限类推》,下文省称《应否》)中了。在这次会议上有幸聆听到各位专家学者的意见,在坚持原来的有限类推的主张的同时,也对一些问题有了更为清楚的认识。
《应否》一文已经指出,起码在字面上《简化字总表》对是否无限类推说得并不明白。其实《总表》的制定者是想无限类推的,这一点在《中国文字改革委员会关于简化字问题的请示》中说得很明白:“凡原方案所有已简化的汉字,用作偏旁时应同样简化;原方案偏旁简化表中所列偏旁,独立成字时也应同样简化。因为只有这样,才能尽量保持汉字原有的系统,便于繁简两体互相对照,因而也便于教学。”但是当时对汉字的使用前景是一种暂时的观点,即认为汉字“要走拼音化”的道路。所以汉字简化只是汉字改革的“最初步”的第一步骤,只是“使初学者容易书写,并使印刷体和通用的书写体尽量趋于一致。”罢了(《中共中央关于讨论汉字简化方案的指示》1954-11)。因而在制定《总表》的时候,第三表(即《应用第二表所列简化字和简化偏旁得出来的简化字》,本文省称为《类推表》)才会“基本上以《新华字典》(1962年第三版,只收汉字八千个左右)为标准”了。虽然《总表》接着说“凡用第二表的简化字或简化偏旁作为偏旁的,一般应该同样简化”。据我们今天的推测,当时的制定者会以为,《类推表》已经够用了,那些连《新华字典》都没有收入的汉字,“初学者”和广大群众基本上是不会用到的。对于那些“很生僻的字”,大概只有印刷“古籍和其他特殊原因”才会用到,而那时便可以按照《国务院关于公布汉字简化方案的决议》里的规定,直接使用原来的繁体字就行了。当时,既没有想到汉字会有这样长久的生命力,也不可能预见到中文信息处理如此迅速发展的局面。
正因为这样的原因,《总表》就存在许多不完善和模糊的地方。
比如《总表》说:“以‘余’代‘餘’……虽然群众已经习惯了,而在某些情况下却不适宜,需要区别。”因此《总表》在第一表“余”字条下加了如下一个注释:“在余和餘意义可能混淆时,仍用馀。如文言句‘馀年无多’。”但是,这个类推出来的“馀”字却既不见于第一表,也不见于《类推表》 。再比如,《类推表》只有閻的簡化字阎,而沒有閆的简化字闫,而这两个字却都是国人的不同姓氏。而且,什么叫“偏旁”,是否只有第二表的简化字才能做偏旁,《总表》或是没有说明,或是仅据《新华字典》或其他常用字立论。今天,我们对汉字部件、汉字拆分已经有了更为深入的认识;而计算机上汉字“超大字符集”的出现也把问题提到了我们的面前。据北京大学章琼先生的研究,不仅《总表》的《类推表》中有些字仅仅根据第一表类推不出来,而且如果以《汉语大字典》为范围,就要类推出12818个新的简化字。这些新的简化字是一些古人没见过,今人也不会用的“新死字”,这只能对汉字资源形成极大的两费。事实上还如章先生所论,它还会导致一批同形字出现,还会出现一些半繁半简的怪字形。这就说明,即使主张“无限类推”,也必须在一个新的基础上制定详细准确的条例,才有可能实施。
考虑到目前使用汉字的国家和地区的书写习惯,考虑到应该使中文信息处理标准统一,所以本文建议以GBK字库的简化字为类推的范围,这也就是GB 13000.1的全部中、日、韩(CJK)统一汉字字符部分。它是目前最新的国家标准GB18030-2000中除去扩展A、B的部分。
这一部分的汉字,即在 I 区统一编码的汉字共 20902 个,按部首——笔画排序。其中中国大陆地区使用的汉字约 17000 个,据说,其源字集是国标基本集简化字(即GB2312-1980的6763个汉字),第一、三、五辅助集繁体字(在DOS时代使用过较高版本的WPS、UCDOS等有“繁体字”的汉字系统的人,都用过这里的第一辅助集),现代汉语通用字表,邮电通信字符集,台湾地区的 CNS11643 《通用汉字标准交换码》,此外还吸收了香港用字 58 个,延边地区朝鲜族使用的“吏读”字 92 个。CJK 统一汉字编码字符集中日本用汉字和韩国用汉字源字集分别为日、韩两国的有关标准。可以认为,它已经基本涵盖了通常用字的范围。当然,这样做也意味着必须对《总表》进行修订。比如《总表》第一表已经规定了钟是鍾、鐘的简化字,但是在国标基本集的简化字中就有了一个新的类推简化字——锺。众所周知,鍾是一种酒器、容量单位,而鐘是一种乐器。在聚集义上,如鍾爱、鍾聚时是不会用鐘的。所以我们可以把钟只作为鐘的简化字,而把锺作为鍾的简化字 。这样做也意味着对《第一批异体字整理表》的修订。比如CBK字库中的镕字就是一例。
采用这一范围出现的新的类推简化字并不像有的先生以为的那样多。我们仍以《应否》一文的17个可疑类推的简化字以及4个简化偏旁为例,列举出《类推表》所没有的新的简化字(表中用“+”表示本行有此字,“—”表示本行没有此字):
新类推字 诜 讬 讱 诐 诪 谉 谞 饤 饾 馀 馂 馌 闫 闳 闶 闬
GB2312 + — — — — — — — — + — — + + + —
通用字表 + — — + — — — — — + — + — + + —
阇 阓 阘 阛 纤 缍 缋 缏 纮 纻 绤 绬 绹 缊 缐 骣 驲 骃
— — — — + + + + — — — — — — — + — —
+ — — + + — — + — + + — + — — + — —
骉 骍 騑 骕 骙 骦 轵 轾 辁 轪 辀 辌 辒 赀 赇 贠 赑 赟
— — — — — — — + + — — — — + + — — —
— + — — + — + — + + + + + — + — + —
觍 飑 飚 飏 飐 飖 钜 钣 钸 铖 铘 铴 锊 锍 锖 锪 锩 锬
— + + — — — + + + + + + + + + + + +
— + — — + — — + — — + + + — + + + +
锺 镆 镙 镟 镡 钑 铇 铔 铚 铦 铻 锜 锠 锳 锽 镈 镕 镠
+ + + + + — — — — — — — — — — — — —
— + — — + — — — + — + + — — + + — +
镵 鹎 鹱 鸤 鸴 鸻 鹀 鹍 鹓 鹔 鹝 鹟 鹠 鹢 鹮 鹯 鹲 鹲
— + + — — — — — — — — — — — — — — —
+ + + — — — + — — — — + + — + — — +
鹴 颚 颎 颒 颕 颣 麴 麺 龁 龂 鲕 鲴 鲺 鲼 鳋 鳐 鱻 鱾
— + — — — — + — — — + + + + + + — —
— + — — — — — — — — — + + + — + — +
鲀 鲃 鲄 鲉 鲌 鲓 鲘 鲪 鲬 鲯 鲹 鲾 鳀 鳂 鳈 鳉 鳚 鳠
— — — — — — — — — — — — — — — — — —
+ + — + + — — + + + + + + + + + + —
鳤 鳡
— —
+ +
必须声明,这个144字的结果是根据中国社会科学出版社1999年出版的《21003汉字编码大字典》查出的。但是这本字典的汉字编码并不完善,有一些遗漏,比如骉、鱻等字就没有,虽然本表有一些增补,但仍不完善。所以这个数字仅有参考价值。
如果采用有限类推的主张(会议上似乎多数人的意见如此),那么我们认为既划定了类推范围,就不能“灵活”掌握。因为作为国家的规范,是不能由某些个人去“灵活”打开缺口的。这只能是法不容情。也许他们有很充分的理由,那就需要经过合法的程序由国家语委以及有关的机构批准才行。对于中小学语文教材的编写者(教材中会选入一些文言篇目)、语文辞书的编撰者,他们不妨在给出不类推的繁体字的同时,也给出类推的简化字。但是这仅仅作为一种“字体”而存在,就像今天的计算机汉字字库里可以有“隶书”一样。隶书并不是我们今天通行的印刷体或手写体,但是它可以作为特殊应用而存在。所以我们可以在通用的宋、仿、楷、黑四种字体之外,再建立简宋、简仿、简楷、简黑这些字体库。这些字库可以使用修订后的汉字部件简化类推原则去类推简化。当然,在类推的时候,就不能仅仅限于《总表》的第二表的简化字和简化偏旁,即使是第一表的简化字,如果成为另一个汉字的直接部件,也可以类推简化 。这种方法作为一种权宜之计,是否可行还要倾听大家的意见。 |
|
|
|
|
|
|
| |
本周最热论坛帖子
|