查看: 810|回复: 7
|
[转贴]破译汉字密码,再创汉字辉煌 (关键字:郑码 , 郑易里教授)
[复制链接]
|
|
关键字: 郑码 , 郑易里教授, 字根通用码, 字根通用编码输入系统, 康熙字典, 英华大词典, 汉字字形编码系统
破译汉字密码,再创汉字辉煌
郑易里教授和计算机全汉字信息处理
出处:china-e.com.cn 日期:佚
世界最著名的汉学家,600余万字的《中国科技史》的作者,英国人李约瑟,这位把毕生精力都用来研究中国科技史的可敬的老人,在他1995年去世的前一周曾经说过,“我等不到用计算机处理《康熙字典》全书的那一天了。”意思是当时今计算机还未能处理他情有独钟的全部汉字。
3年以后,1998年11月,在新落成的香港会展中心,将要举办“世界华人发明博览会”。中国发明协会组织300多项优秀发明赴港参加,美国、日本和台湾、香港等国家和地区的华人发明协会也精心选拔了200多项优秀发明前往,这是世界华人第一次智慧的大检阅,也是香港回归后举办的最大科技盛会。在这来自世界华人的500多项优秀发明中,引起观众和各国评委极大兴趣的却是一位来自中国大陆的女发明家——郑珑。她带来的“计算机全汉字信息处理系统集成”项目,当众演示对中华民族五千年所有的10万汉字,运用计算机进行检索、输入、编辑、排版、打印。她在众目睽睽之下,像变魔术一样轻击几下键,只见从激光打印机中缓缓地推出一张张比原版式还精美的《康熙字典》样张!这说明,在本世纪末,应用计算机处理全部汉字信息的历史使命已经完成。李约瑟老先生也可以暝目了。3天以后,在本届大会的颁奖仪式上,这项重大发明取得了最高评分,荣获了最高大奖。香港特区首长董建华先生亲自郑珑女士颁奖,与会代表上千人,热烈的掌声持续不断。
人们也许不会想到,这项比解开世界数学难题《哥德巴赫猜想》更艰难复杂,对人类更有意义的发明,这项攀登汉字信息处理的珠穆朗玛峰的成功!却是世纪老人郑易里教授和他的弟子们,历经半个世纪呕心沥血、殚精竭虑的结晶! |
|
|
|
|
|
|
|
楼主 |
发表于 21-9-2004 06:48 PM
|
显示全部楼层
奋斗一生,架起三座大桥
郑易里,这是一个与二十世纪中国紧紧联系在一起的名字。他第一个组织翻译出版了《资本论》、主编了新中国第一本《英华大词典》,从而架起了马克思主义与中国、西方文明与中国之间的桥梁。又是他第一个架起了古老汉字通向当今信息时代的桥梁。
郑易里,1906年10月出生于云南玉溪,从北京农业大学毕业后考取日本东京工业大学。
日本是中国的近邻,是汉文化的受熏国。可是明治维新以后日益强大的日本不知究竟是由于自卑还是由于自傲,总是千方百计地欺侮中国。1928年日本军队制造的济南惨案激怒了留日的中国学生。郑易里一腔悲愤地回到上海。正像鲁迅从“健康救国”到“文化救国”一样,郑易里从实业救国走上唤起民众的道路。他从经商的哥哥郑一斋那里借来3,000银元,与李公朴等人办起《读书出版社》,专门出版发行进步读物。于是《读书出版社》与邹韜奋的《生活出版社》一起成为进步书籍的代名词。郑易里与艾思奇合作,将苏联大百科全书中的《辩证唯物论》一书翻译为《新哲学大纲》,以公开方式传播马克思主义,该书1936年出版后连续印刷14次。
郑易里组织翻译出版马克思的名著《资本论》是中国出版史上的光辉篇章。那个风雨如晦的年代,谁敢承担这种既可能掉脑袋又赔大钱的事情?郑易里當仁不让。他又屡次向哥哥借款,哥哥明知道这前后数万大洋有去无回而仍然慷慨解囊。一个共同的心愿使这双兄弟心有灵犀——做“盗火”者,拯救中华民族的普罗米修斯。日本侵略军占领上海,郑易里冒着生命危险留守,将翻译、排版、印刷出版组织在一起,同时负责全书的审校。就在中华民族危亡的关头,第一次印刷出版的3,000套《资本论》洒向大江南北、长城内外。毛泽东等中共领袖也是通过郑易里的出版才读到《资本论》的中译本。周恩来非常关心郑易里的安全,得知郑易里辗转香港、越南终于到达重庆,曾多次亲自过问在重庆再版《资本论》的事宜。
郑易里是一位具有前瞻眼光的学者,深知中国近代落伍的一个根本原因是封建统治者的愚昧和闭关锁国。他决心为自己的同胞提供一部大型的英汉词典,以架通中西之间的交流桥梁。经过几年宵衣旰食,郑易里将这部《英华大词典》献给了朝气蓬勃的新中国。这部词典前后印刷几十次,发行100多万册,哺育几代海内外英语学习者。人们只要谈起“郑易里词典”,马上就发现大家原来有着共同的老师。1984年12月英国首相撒切尔夫人在北京签订了1997年香港回归祖国的协议后,中国总理送给她的两件“国礼”中就有一件是这本《英华大词典》。 |
|
|
|
|
|
|
|
楼主 |
发表于 21-9-2004 07:08 PM
|
显示全部楼层
挑战“汉字落后论”,探索汉字简易快速检索
汉字,是世界上人口最多的中华民族的伟大创造。从山东大汶口发现做在陶器上的汉字雏形来看,已有5000多年了。几千年的演变成为今天的楷书汉字,已是世界上流传到今的最古老的文字了,它承载着中华民族灿烂的文化,经历了五千年历史的沧桑。
1931年9月,当时600多位著名专家学者,曾在海参崴集会,集中批判了汉字,“汉字不能实现机械化,不适合现在的时代”的淘汰汉字论;“最糟的便是它和现代世界文化格格不入,汉字应当西化”。通过了《中国汉字拉丁化的原则和规则》的声明。汉字从来未有受过这么大的威胁,似乎就要灭亡,唯一出路只有西化了。这时对汉字已有一些研究的郑易里认为不能全面否定汉字,要想办法也能将汉字书写像西文一样能机械化。他当时并没有意识到,这个想法竟成了他一生为之奋斗的宿愿了。要用机器书写文字,首先要解决的就是汉字快速检索。西文只是用20—30个字母拼写,检索很容易。而我们的老祖宗,几千年来陆陆续续发明了光辉灿烂的汉字,但却是几千、几万个形状各异,千差万别的汉字。这些汉字也给他的子子孙孙留下了一个比“哥德巴赫猜想”还难解的难题。这就是实现对所有汉字的有序快速检索。
公元前后,距今2000年,汉字已有上万个,其时后汉的许慎撰30卷“说文解字”(公元100年),将当时的汉字进行了系统的整理,为了检索的需要,创立了部首检索法。这种检索方法延续改进了一千多年,到清康熙年间(公元1721年)编篡《康熙字典》时汉字已增加到了47000多个,为了检索方便,规范出了214部的部首检索法。就是这个部首检索法,直到1986年我国专家在制定国际汉字标准时,仍是主要的检索依据。但是,部首检索法,歧义性很大,汉字部首可以在汉字的上、下、左、右、内、外存在,有许多汉字,就是研究汉字的专家,也很难立刻确定它的部首是那一部分。有时找到部首,仍查不到字,还要数笔划,一本字典要翻前翻后好几次才能查到所要找的字。平均查一个汉字要5—6分钟。所以,不解决汉字的简易快速检索,汉字的书写机械化就无从谈起。这就是郑易里在本世纪20年代末所面临的状况。
1929年,上海《时报》展开汉字改革的讨论。年青的郑易里根据他的初步研究,提出了组成汉字基本的笔划是“一、丨、丿、丶、乛、乚”六种笔划。提出按笔划顺序排序检索的主张,向使用了1000多年的部首检索法挑战。这是他对汉字进行科学分析的滥觴,是汉字实现快速检索的初期。1950年他主编的《英华大词典》出版,其中文检索部分,就是应用他研究的由1、2、3、4、5、6阿拉伯数字代表一、丨、丿、丶、乛、乚六种笔形代码化的简易检索法了。这是有记载以来,中国第一个汉字检索简易代码化的成功案例。
这以后的四十多年来,他的业余时间几乎完全沉浸在对汉字的分析研究中,集中精力做他的汉字求索,一夜一夜,一年一年的绞尽脑汁的思考和研究、分析和运筹,查遍有关的字典和书籍,几十年如一日坚韧不拔。他写的文稿、笔记、方案堆满了屋子。他将几万个汉字的笔画、另部件逐一分解,制成30多万张卡片,对每一个汉字的笔划、起笔结构、笔顺等各种属性进行分析和频率统计。然后再集中归纳运筹从中找出统一性、特殊性、规律性的东西。从字根的选取到字型的分类,从笔画的组合到整字的分解。既要符合汉字字形的结构规则,又要继承汉字以部首为脉络的有序性。理顺汉字笔划一字根一单字一词语的检索序列,苦苦地探索几千年老祖宗几乎是没有规律,自然成长的几万汉字。像整理成千上万团乱蔴,一一解开理顺。在内战混乱,运动不断的年代,又要做好白天的社会工作,又要在这几千年汉字群中孤军奋战的挖掘,这要有多大的超人毅力和智慧啊!点点滴滴的积累,多种矛盾的运筹和巧妙的安排,就靠这千锤百炼,坚实的层层积累,终于逐步建立起以汉字字形特征编码的完整科学的全部汉字快速检索的体系。 |
|
|
|
|
|
|
|
楼主 |
发表于 21-9-2004 07:09 PM
|
显示全部楼层
把汉字快速输入计算机
把汉字输入计算机,除有计算机外,还要有操作系统、汉字库和输入方法,三者缺一不可。所谓输入方法实际就是汉字检索代码化。把每一个汉字,改编成机器能读识的代码,而把信息含量大的平面图形汉字科学地有规律地转变成线性代码,让计算机能很快地读识,然后显示和打印出汉字来。怎么才叫快速输入呢?就是将汉字代码输入的速度,达到人的正常语言速度,即每分钟200汉字以上。才能称为解决了汉字迅速输入计算机的难题。
把汉字进入计算机,1959年已由美国国际商业公司(IBM)实现。他们设计的卡德韦尔汉字打字机(Cald well的Sinotype),按每字笔划顺序打制孔码。笔划多的码数多,少的码数少。一共只能打2333个汉字。其后,有photon公司的“辅键式汉字打字机”,能5040个汉字。每次必须在大键面上标出的5040个汉字中找到所需之字,右手按下该字所在大键,左手按下标有该字数字位码的一个辅键,电脑才能把该字反映出来。辅键共有30个。用起来非常麻烦。
进入本世纪60年代,日本、美国、加拿大、前苏联、台湾、香港等地的专家们,力图将汉字快速地输入计算机的各种方案竞相出现。它们力图将组成汉字的几百个部件、笔划如何科学地按排在键盘上,将键位从168个大键,30个铺键的方案基础上缩小,于是不断有108键、96键、87键、64键的报导出现。这个进展阶段大约持续了十几年,从单纯地把组成几百个汉字部件简单地压缩到键位上,到部件、笔划的代码化,达到最后运用通用键盘上的从A—Z 26个键位方便、科学、灵活地将汉字输入计算机。
1964年郑易里已在研究汉字结构和快速检索的基础上推出了《汉字四拼字码方案和打字》的完整方案。这个方案,就已经实现了只用32键将汉字拆根输入的编码法。尤其是他经过大量分析统计认为每个汉字最多用4个代码是检索汉字最精炼、最科学的码数。当时他将这个方案汇报给邮电部后,邮电部当即派了2位技术人员配合他完善和实现这个方案。在这个方案中,郑易里还建议,邮电部和科学院等单位组成协作组,运用世界刚刚兴起的电子计算机来迅速攻克处理汉字的难关。这个建议比后来的“748”工程早提出十年。随后,“文革”爆发,邮电部的2位技术人员撤回。在那艰难的岁月中,郑易里一边被捲进运动中去,一边修订他主编的《英华大词典》,一边注视着国外汉字输入计算机的各种方案的进展。他心急如焚,可又无可奈何,只有自己孜孜不倦,日夜奋战。到“748”工程开始时,他的字根编码理论和方案已引起各方面专家的重视。1978年8月,“748”工程对汉字库的压缩、编辑、排版的设计和激光汉字照排已顺利实现。光明日报当时做了报导,并将照排的样张也做了公布。轰动了国内外汉字印刷界。可是它的汉字输入法是拼音法,由于汉字重音字多,导致输入时重码率高,输入速度慢。就像计算机运算速度已是高速公路,而输入法却是牛车!要实现快速输入,还得是形码输入法!
1980年11月,郑易里与邮电部第七研究所合作,第一个在世界上完成了只用从A—Z 26个通用键位将汉字字根代码化的输入方案。他们运用这个方案对《标准电码本》内全部9324个汉字,增补了《标准电码本》中没有,而收入《新华字典》(1979年修订本)中的1726个汉字,共11050个汉字进行了编码,重码字130字,占总编码字数的1.2%。这个重大成果,已大大领先当时国外十几年许多公司和专家研究的汉字输入成果。率先攻克了26键大关!当时,双方约定对方案保密,争取资金实施。后来,邮电部单位调整,人员离去,又只剩下郑易里继续奋战了。
1979年,郑州一位陶工程师研究了一种汉字编码方案,河南省科委组织鉴定,约请郑易里去参加。在会上郑易里坦诚地对这个方案提出了些建议,他的精辟见解引起很大震动。第二天,河南科委请郑易里做专题报告,他有关汉字编码字根论的研究理论及方案进展,激起听众极大兴趣。当即就有人电告了在南阳科委工作的王永民。王永民一听如获至宝,星夜赶到郑州,见到了郑易里,诚心讨教,这时他才知道有汉字还有编码一说。以后,他带人跟踪到北京,到郑易里单位和家中虚心请教,郑易里也诲人不倦,所问必答。1980年,南阳科委立项拨款研究汉字输入编码课题,邀请郑易里去南阳指导协助,郑易里见南阳科委这么支持汉字编码研究,王永民等人如此求知心切,他非常高兴。此时正值酷暑8月,时年已75岁的郑易里一到南阳,就连续讲了7天课,将自己多年对汉字,对汉字编码的理论和方案研究心得和成果,都传授给了王永民等人。以后从1980年8月到1983年8月的3—4年间。郑易里不顾高龄。4次应邀去南阳指导和帮助课题组一起实现这个后来称为“五笔字型”的汉字编码项目。
1982年,郑易里在工作单位中国农科院的支持下,率先实现的《26键位汉字拆根输入码方案》已经成熟。这个时候,台湾的仓颉码在当地已开始流行,不过它也还是36键位。仍未达到通用键盘26键的水平,还要借助从1—10的数字键。当时南阳的课题组,虽然努力,但事倍功半,长期停滞在48键上。当郑易里的26键方案6月份定稿印成册后,得到农科院的许可,他最先就给南阳的王永民寄去。王永民接到后,大喜过望,在给郑易里的回信中,掩不住激奋之情地写到”这是一个伟大的成功!是字形方案的高峰上插上一面鲜红的旗帜!体系的严密,科学思想的一贯,构成的精密,使用方法之简易及实编效果的惊人!并认为这是形码界爆炸的第一枚原子弹!同年11月在北京西郊举行的“汉字信息处理技术学术交流会”上,郑易里将这世界最先实现的26键的具体方案广为散发。与会的专家问郑易里,这是您多年研究的巨大成果,这一散发出去,别人不是很容易偷去吗?郑易里回答,中国大陆是汉字的发源地,最好的汉字编码,应该诞生在中国大陆,只要是中国大陆的人,谁拿去用都一样!
几个月以后,南阳课题组实现了25键的“五笔字型”。1983年8月“五笔字型”在郑州召开鉴定会。在鉴定会议的研究工作报告中写到,“我们不知道怎样用言语表达我们对著名学者郑易里先生的感激之情……”。可以说,“如没有郑老的理论作基础,WBZX(五笔字型)方案将不能成立”。“如没有郑老的教益和指导,也许到今天我们还一无所获!”鉴定会后,大家都非常高兴。但是,郑易里清醒地告诫课题组说:“五笔字型”还有许多问题,汉字编码是涉及到汉字文化和教育大事,应该改进以后再推出。可是市场不等人。“五笔字型”推出了,由于它适合了当时社会汉字信息处理需要,推广的很成功,普及的很快。但是它的繁琐、缺乏系统性和不规范性,也引起越来越多的专家责难。
这时,郑易里感到自己对社会的责任和理想,并没有完成。一个比较理想的汉字输入法还没有产生。什么是理想的输入法呢!首先它要完全符合国家文字规范与人们头脑中对汉字的认知一致;要容易学,使老幼都易上手;要有风驰电掣,每分钟超过200字的口语速度;要通用,也就是中华民族的几万汉字、日本汉字、韩国汉字、香港汉字用它都能轻易地编码和输入!绝不能七拼八揍,而要有一个完整的编码规律和体系!
1985年,郑易里的《26键汉字拆根输入码》通过了鉴定,专家们给予很高评价。郑易里在80岁高龄下离休了。他半个世纪的努力和愿望,不该诞生了一个“五笔字型”就草草收场。他有飞机制造工程师职称的女儿,在1988年一个偶然的机会,接过他老父的接力棒,她的丈夫是管理专家和高级工程师。他们各自的优势搭配,产生了1+1>2效果。在郑老无人能与之比肩的造诣和创造性思维指导下又得到了中文信息界的许多专家支持。对父亲的科学成果又进行了创新和优化。从而使郑老的26键成果,如虎添翼,迅速得到提高和系统完善。1990年7月,经过国家主管部门组织的严格评测,编码输入系统各个测试项目全面达到优秀,总水平居世界领先。11月又通过国家级鉴定,肯定了郑易里在我国编码学术领域的奠基贡献和《郑码》编码系统的世界领先水平的地位。
在鉴定中专家们还发现郑易里独具匠心地为《郑码》设计了一套将字根按一、丨、丿、丶、乙五种笔划的国家规范顺序排列中还巧妙地根据汉字笔划的起笔的频度与按英文从A—Z序列设计的具有联想构思的字根表。这样就科学地将人工检索汉字与计算机检索汉字有机地结合在一起。它的特点在于破除用多歧义性的部首法检索汉字,而用《郑码》的字根检索法来编汉字字典。如果从小学生起就教会他们会用《郑码》检索法查字典。那末以后一接触计算机,《郑码》检索法就是输入法,完全不用新学或培训。试想,这会对提高整体国民在信息时代的科技素质起到多么重大的作用啊!
1991年《郑码》又经国家语言文字工作委员会专家的审定,《郑码》文字规律已符合国家语言文字规范。
1992年在北京国际发明展的1300多项优秀发明中,名列第一,荣获国家发明金奖和最优秀发明大奖。
同年举办的“海峡两岸电脑汉字输入比赛”《郑码》学生的繁体字输入速度大大超过台湾选手。
1992年中国标准技术开发公司根据国家课题完成了当时世界最大的6万电脑大汉字库,但无法检索应用。专家们分析了各种输入法后,认为只有《郑码》有可能完成,郑珑用不到20天。6万汉字竟全部编码完成。当给专家们汇报演示时,专家们都不敢相信自己的眼睛!
在国家电脑大汉字库诞生的新闻发布会上,操作员用《郑码》轻击4键就能准确和快速地从6万汉字中检索出任一汉字,令国内外专家、记者大开眼界,连呼“奇迹”!
1994年《郑码》又荣获日内瓦国际发明金奖,国际评委们评价“《郑码》汉字编码输入系统的发明,对中国和亚洲的文化信息事业做出了重大贡献!”
这个时候,应用《郑码》的快手,输入的汉字速度已超过每分钟240个汉字,超过了正常语言速度。成功地解决了汉字快速输入的历史难题。从1990年《郑码》汉字编码系统已六次经过国家级的各种严格考核。国家主管部门,在1993年对《郑码》进行了又一次的评审后,20年来第一次放心地向全世界用户推荐,请您们放心地选用具有世界领先水平的《郑码》汉字编码系统吧! |
|
|
|
|
|
|
|
楼主 |
发表于 21-9-2004 07:10 PM
|
显示全部楼层
冲击曲线汉字库,把中文信息处理技术走向世界
《郑码》经过一系列国家级的测试、鉴定、评审,都认为具有世界领先水平之后。这个经过千锤百炼的汉字编码系统可以定型推广了。郑易里建议接过他的接力棒的中易公司又瞄准了新的目标——曲线汉字库。因为,这是除了我们无力问津的操作系统以外的中文信息处理的另一个关键因素。
汉字库是中文信息处理的最终表现,因为大家看见的不是输入法,也不是操作系统;而是用精美的汉字打印出来的文章。电脑用汉字库的初级阶段是由各个“点”组成的汉字字形。称为用“点”来描述汉字。它不能无级放大、缩小,要像铅字一样大小分号,而且略大一些的点阵字、笔划边就像锯齿一样难看。当时通用的排版系统上的汉字库是中等技术级的矢量汉字库。即是用直线来描述汉字字形,直线部分自不必说,而曲线部分,是用许多折线来组成。这种汉字库,稍一放大,就会由于显出曲线部分的折线来,产生变形而无法使用。当中易公司要进入汉字库开发领域时,决心越过矢量汉字库,迎头赶上世界最先进的用曲线描叙汉字字型库的技术。当时世界上只有美国2—3个公司有这种用曲线描叙西文的技术,而用曲线描述汉字要比西文庞大复杂的多。公司利用世界上已公开的曲线描述字形的很少资料,组织软件工程师们向曲线字库的纵深领域进攻,同时聘请国内最权威的字模专家做字形的技术总监,并和中国标准技术开发公司专门开发国家标准点阵字库部门合作,一场向世界最高水平,符合国际曲线标准汉字字模的战役全面展开!
做曲线汉字字模是一件周期长、技术水平很高、风险大、资金投入大的项目。中易公司已连续创业4年,基本上都在完善《郑码》而没有什么收入。当为寻求开发曲线汉字库的资金,向一些大电脑公司寻求合作时,他们却认为符合国际标准的20902个汉字的曲线汉字库的应用时机还很遥远。现在就投入大量资金开发风险太大,怕得不偿失,于是都婉言谢绝。
但是中易公司认为,在信息时代,技术的更新,不是逐步到来的,而是像三级跳跳来的。我们是中国人,不但要在汉字输入法方面世界领先,在汉字库的技术领域,也要领先,才不愧对发明汉字颇讲书法艺术的老祖宗!
事情果然像预料的那样,1994年初,世界最大的美国微软公司把刚刚诞生才几个月的Windows3.2 中文版就准备抛开,全力开发32位操作系统的Windows 95中文版。包括中、日、韩三国的20902个汉字的国际标准。美国微软的工程师很快来北京调查,谁家有这20902个国际标准的汉字库?哪个输入法能支持(检索)这20902个汉字?他们马上找到了中易公司,他们在了解《郑码》能不能支持(检索)20902个国际标准汉字时,中易公司给他们演示的却是当时世界最大的国家6万电脑大汉字库的输入(检索)。他们看到《郑码》只用4键就能迅速准确地输入6万汉字时,惊讶之极,难以言表。即然6万字都这么干净、利索地输入,20902个汉字还在话下吗。再问到谁家有这20902个曲线汉字库时,中易公司轻松地将打印好的全套样本展现在他们眼前。以后的半个月,他们曾4次派不同级别的工程师和管理专家来中易公司咨询考查,确认一切完备无误后,要了样品才满意离去。
从这以后,随着Windows中文版的推广,每天在全世界已有几百万人在享用中易字库和《郑码》了。
富有趣味的是韩国三星公司的“选码大战”。1994年未,当届韩国总统金泳三在访问日本、中国时提出,中、日、韩三国的科技人员应合作设计三国能通用的汉字信息标准和软件,以促进三国的经济、技术和文化的交流和发展。1个月以后,三星公司受韩国政府委托,来中国大陆“选码”(选汉字输入法)用来完成韩国训民中文系统和将珍贵国宝《高丽大藏经》电子化,中文信息学会向韩国推荐了十几种输入法。不久三星公司派来三位专家。在中文信息学会的配合下,马不停蹄地将这十几个“码”轮番考核、测试、筛选。这十几个码的发明人也极力向他们介绍、演示,一时大有“编码大赛”的态势。第一批选中的输入编码他们都要求能回国试用,工作态度十分认真严格。他们在回国测试期间,台湾许多的输入法发明人,闻讯后也向三星公司纷纷举荐。因为大家都明白,他们选中与否,不只是转让费的问题,最主要的是在这一场“码赛”中赢得的声誉。又一个多月以后,三星公司通知中易公司。经过严格测试和考核,公司高层领导的“拍板”会决定,原来准备选三种“码”(输入法)的打算,现在决定只选一种就可以了,那就是《郑码》!希望双方签约合作事项马上开始。
在这以后的3—4个月中,根据双方合同,郑珑应邀到韩国传授《郑码》。面对一点不懂汉字的学员们,不可能走先认识汉字,再输入汉字的路子。她因人而异,从汉字的基本结构讲起,教给他们了一条把每个汉字看成是一个图形的“捷径”。边讲边翻译边练习,几天过后,原对汉字视为天书的学员,已能断断续续地输入汉字了,不到半个月,郑珑回程之前,学员们已达到每分钟20多个汉字的水平。2个月以后,三星来电话说,奇迹出现了,学员们录入像《高丽大藏经》这样复杂的汉字文本已达到每分钟7—80字水平。三星公司总裁闻讯赶去视察,高兴地说:“这是三星公司最成功的一次技术引进!”
目前,《郑码》输入法手册已经有香港繁体字版、韩文版、日文版出版发行,用户已遍布国内外,《郑码》已走向了世界! |
|
|
|
|
|
|
|
楼主 |
发表于 21-9-2004 07:10 PM
|
显示全部楼层
向中文信息的“珠穆朗玛”冲击
1996年11月,刚刚荣获了国家科委、国防科工委、中国科学院、中国科学技术协会及全国自然科学基金会联合评选颁发的《全国科技信息优秀成果一等奖》的中易公司,从报纸上看到日本政府投资3亿日元资助东京大学和日本新技术促进会联合开发8万电脑大汉字库的消息。他们非常震动。因为在计算机中能否处理大型汉字集,一定程度上代表中文信息处理的水平。当时我国的最大汉字库是6万点阵字库。虽然在中文信息处理方面我们应当领先世界。但是设计制做大型汉字库,尤其是用世界最先进的曲线字模技术来实现,是一个巨大的系统工程,投入资金很大。台湾开发54000汉字库时也是当地政府出资,经历十几年开发完成的。中易公司到国家计委、国家科委申请资助,答复是去办申请立项,报计划。他们明白,这一申请报计划,像做房地产跑前期一样,不盖几十个图章,跑个1—2年不见得下的来。可是现在是在和日本人赛跑,时间不等人啊!中易公司横下一条心,砸锅买铁,也要开发出世界最大,水平最高的10万汉字库!
1998年10月,不但历经艰难,而且发挥出高超的设计思维完成了全部10万汉字曲线字模。并且在中国“微软”的支持下,创造了多页面自动识别的扩充技术,将Windows95、98中文系统扩充支持这10万汉字。对功能强大的Word97排版系统也设法进行了扩充,使它对10万汉字编辑、排版、打印运用自如。当十万汉字的精美打印稿,请国家语委的首席专家审阅时,他无限感慨地说:“这是国宝啊!你们要保护好、利用好啊!”当用这个大型中文软件排出连铅字印刷技术传入我国100多年来都没解决的难题——《康熙字典》原版式样稿时,在印刷界的专家、中文信息处理专家、古籍专家中引起很大震动,新华社为此向全国转发了专稿,向国内外宣告,从今以后,计算机处理汉字,已无所不能了。中文信息全汉字处理这最后难关被攻克了。而郑老和中易公司的专家们也好像历经艰险,爬上了世界屋脊——珠穆朗玛峰一样既精疲力尽,又感到无限欣慰和自豪。 |
|
|
|
|
|
|
|
楼主 |
发表于 21-9-2004 07:11 PM
|
显示全部楼层
迎接21世纪信息网络的挑战
比21世纪到来的更快的是信息网络时代。它使人们突破空间、地域的限制,方便、快速、及时地共享信息资源。有的专家还预言,那个国家跟不上信息网络时代迅速发展的步伐,就会导致经济、技术、商业、文化、教育等信息接受和发展的迟缓。
现在我国的计算机拥有量已突破1000万台。3—4年以后就会超过2000万台。上国际互联网的网民,在短短的3—4年间已超过400万。2—3年以后就会达到1000万。而在美国,1998年中,网民已达6500万,而一年多以后的现在网民已超过1亿,几乎占全部人口的一半。现在信息社会的发展,已不再是螺旋式的上升、波浪式的发展,而成跳跃式的发展了。
可是,国际互联网络在中国的发展却会遇到一个大拦路虎。它就是中国特有的中文网络发展迟缓,而大型中文网络还几乎是“零”。因为国际互联网是英文的世界。即使你只想浏览有限的中文网站,但在进入网站的关口,你也必须输入用英文单词表示的网址。倘若你不知道你要进入的网址的英文,你就必须用搜索引擎去搜索。即使你知道使用搜索引擎去寻找你所需要的网站,你也要输入搜索引擎网站的英文地址。
那么中国有多少人能直接用英文上网和游览呢?就算你是英文很好的人,在找英文化后的中国网址也是歧义性很大,困难重重。
所以,在21世纪,我国在各方面要有一个大发展,信息网络化的发展就是经济、技术、商业、文化教育发展的基础。而信息网络化普遍发展的关键,就是信息网络中文化,才能让广大的中国人民接受。
国际互联网做为通讯工具还仅是它的一小部分,而大部分的应用还是网上资料查询,经济、技术、商业往来。而资料查询,则大千世界古今中外就无所不包了。而做为中文的查询,也就是全文的汉字检索,则比西文要复杂的多。
目前,为数不多的中文网站,只能支持6763个国标汉字的检索。我国做为支持网站资料库的全文检索数据库,也只是支持6763个汉字。而支持国际标准20902个汉字的全文检索数据库还是空白。
也就是说,我们突破了汉字快速进入计算机和全部10万汉字进入计算机的历史的难关。还要打掉网络时代大型中文全文检索网络的拦路虎。中文全文检索的核心技术是将源文档中所有的“基本元素”的出现信息记录到索引库中。这个“基本元素”可以是单个汉字字符,也可以是词。单个汉字字符检索称为“字表法索引库”,词检索称为“词表法索引库”。这两种索引库经过大量对比、分析、实验,“字表法索引库”歧义性小,漏检或错检极少。查全率最高。建立以“字表法索引库”的全文检索数据库,用以来支持大型中文网络的首要两个基础条件就是大型中文网络平台和准确、快速的汉字检索法。它不但要支持国际标准的20902个汉字,还要支持扩充的国际准标准68000个汉字。这才有可能满足随着中文网络的发展而检索汉字的数量日益增多的需要。
而郑易里教授和中易公司在本世纪末,已将这两项最重要的大型基础工程完成了。它们在发展21世纪大型中文网络时代将发挥巨大的作用,它的重大意义我们怎么估量也不会过分。
就在记者准备结束采访时,又传来了“中国卫生卫星科技教育网”准备和中易公司合作签约的消息。因为这个重大项目需要他们的大型中文网络的基础成果。而联合国技术信息促进系统珠海执行中心负责人也赶来表示,非常重视这项具有重大战略意义的成果,诚邀进入珠海开发区,以利于通过联合国相关机构向全世界推动。郑老和他的弟子们为下个世纪大型中文网络时代所准备的信息工具桥—《郑码》和大型中文平台,随着时间的推移,其价值和影响一定会超过他出版的中译本《资本论》的思想之桥和他主编的《英华大词典》智慧之桥。
真是“造化异人,人靠造化异天。”十万汉字长征路是一部关于人,关于人与自然,关于人与造化,造化与人类未来的发展史诗。 |
|
|
|
|
|
|
|
发表于 22-9-2004 07:03 PM
|
显示全部楼层
在 WINXP 所附的 simsun 宋体丶simsun 宋体18030 丶 simhei 黑体 都是来自郑易里教授的中易公司. |
|
|
|
|
|
|
| |
本周最热论坛帖子
|