佳礼资讯网

 找回密码
 注册

ADVERTISEMENT

查看: 1926|回复: 3

《說文解字》全文檢索測試版

[复制链接]
发表于 28-3-2005 08:04 PM | 显示全部楼层 |阅读模式
由北师中文久久提供http://www.chinese99.com/xiaozhuan/shuowen/index.php

説明:

   1. 請確保您的機器裝有支持unicode擴展B面的字體,如宋体-方正超大字符集(Ms office xp以上版本有自带,下载地址),否則部分生僻字無法正常顯示。
   2. 微軟的IE瀏覽器對unicode(UTF-8)支持較差,可能有少量缺字,但把缺字複製到word中即能正常显示。推薦使用Mozilla Firefox瀏覽器,能完美支持unicode(UTF-8)!下載地址
   3. GBK字符集以外的生僻字可用Babelpad(統一碼編輯器)輸入,下載地址
回复

使用道具 举报


ADVERTISEMENT

发表于 29-3-2005 12:44 PM | 显示全部楼层
》》2. 微軟的IE瀏覽器對unicode(UTF-8)支持較差,可能有少量缺字,但把缺字複製到word中即能正常显示。推薦使用Mozilla Firefox瀏覽器,能完美支持unicode(UTF-8)!


補充第2项,其实IE是要另安装以下小程式才能正常显示EXT-B汉字的,这方面FIREFOX则显得比较优秀!
http://chinesecj.com/forum/viewthread.php?tid=177
回复

使用道具 举报

发表于 31-3-2005 01:24 PM | 显示全部楼层

強烈吐血推荐大家下載以上帖子的中文字形-宋体-方正超大字符集﹐因為有65000個漢字


最近這裡網友所貼的其它字形(大約27k-32k漢字)相比﹐跟“宋体-方正超大字符集-65k 漢字”比較﹐ 一看就知道相形見絀了。

文件是 ~19MB﹐ 解壓過后是 41MB﹐將它放在  C:/windows/fonts 就可以了﹐我用英文視窗98可以成功安裝。之後看﹕
http://chinesecj.com/forum/viewthread.php?tid=177

  1. [HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\International\Scripts\42]
  2. "IEFixedFontName"="宋体-方正超大字符集"
  3. "IEPropFontName"="宋体-方正超大字符集"
复制代码


英文視窗98不支援中文文件名字﹐所以我更改了以上的﹐改成下面的
  1. [HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\International\Scripts\42]
  2. "IEFixedFontName"="Simsun (Founder Extended)"
  3. "IEPropFontName"="Simsun (Founder Extended)"
复制代码

這樣真的用IE6.0在說文解字網頁顯示更多文字。至於那個顯示  ext-a 文字的﹐我沒有做﹐英文是 \Windows NT\﹐ 不曉得視窗98可以運用嗎﹖

現在﹐請問如何測試電腦是否能顯示“Unicode Ext-A 漢字內碼”和“ Unicode Ext-B 漢字內碼”﹐是不是瀏覽器瀏覽以下網頁﹐能看到那些漢字﹐就表示支援了﹖
Unicode Ext-A 漢字內碼表 http://www.chinesecj.com/code/ext-a.php
Unicode Ext-B 漢字內碼表 http://www.chinesecj.com/code/ext-b.php
我用 IE 6.0 firefox 1.0.2 測試﹐結果﹕
IE 6.0 :Unicode Ext-A 漢字 能看完全部漢字﹐ Unicode Ext-B 漢字 能看到85%漢字
Firefox 1.0.2 :Unicode Ext-A 漢字 能看完全部漢字﹐ Unicode Ext-B 漢字 完全不能看到漢字﹐部份變成 ﹖﹖﹖﹐部份變成透明不見了留白。

還有一個奇怪現象﹕用 IE 6.0 和 firefox 1.0.2 瀏覽器說文解字﹐嘗試尋找
http://www.chinese99.com/xiaozhuan/shuowen/index.php
比如以下的﹕
http://www.chinese99.com/xiaozhuan/shuowen/index.php?action=displaychar&num=3634
㰍 --IE 不能顯示這個字﹐火狐貍能﹐相反的情形也出現﹐在IE能顯示﹐在火狐貍不能顯示﹐如下﹕
http://www.chinese99.com/xiaozhuan/shuowen/index.php?action=displaychar&num=1760
𠬞-IE能顯示﹐火狐貍顯示是留白的﹐既是沒有任何東西。

現在嘗試在 office 97 的 Word 用 "宋体-方正超大字符集“支援﹐輸入這裡網友給的一些稀奇古怪 unicode漢字:

Unicode 漢字
2792f   𧤯
4cbb   䲻
20aed  𠫭
2a6a5  𪚥   
9f96 龖
9f98 龘

Word97 只顯示 9f96 龖 ﹐9f98 龘﹐其它的不是留白﹐就是兩個方塊四方行。

現在用 wordpad.exe 輸入以上中文字﹐全部正確顯示。

我是用 njstar 裡面的 unicode 輸入法配合 "宋体-方正超大字符集“輸入以上漢字。

最後一個問題﹐這裡能輸入 2a6a5  𪚥   嗎﹖在輸入攔裡面能正常顯示四條龍﹐可是按發表回復之後﹐會變成 #247dhdy%符號﹐希望以上 unicode能正常顯示﹐還有要有"宋体-方正超大字符集“配合才能顯示。最後一句﹕

強烈吐血推荐大家下載以上帖子的中文字形-宋体-方正超大字符集﹐因為有65000個漢字
回复

使用道具 举报

 楼主| 发表于 31-3-2005 02:53 PM | 显示全部楼层

请参考:

国际标准化组织在ISO10646-2000的基本平面(BMP或者Unicode 3.0,下简称 Unicode)编入了27,564 汉字(U+4E00~U+9FFF以及U+3400~U+4DFF),即是2000年3月在GB18030颁布时所建议支持的字汇,其中U+3400~U+4DFF部分的6582个汉字又称为扩展A。同时国际标准化组织还在ISO10646-2000的第二平面扩展了42,711汉字(又称为扩展B)。该42,711汉字的编码表已基本确定,尽管不排除未来微小变动的可能性。由于这42,711汉字编排在ISO10646-2000 的第二平面,所以编码需要4个字节。为了能够存取处理这些4字节字符,在Unicode中引入了Surrogate机制(在ISO10646-2000中命名为UTF-16)。根据这样一种机制, 在Unicode中用两个16位编码就可以对ISO10646-2000第二平面中的汉字进行存取。

Microsoft 从Windows2000(在Windows 98, Windows ME 及 Windows NT4中没有)开始对这样一种机制提供支持。只要有相应的输入法和字库并且在应用程序中给予相应的支持,就应该能够输入显示上述提到的汉字。但是,要想得到对Surrogate全面的支持(包括在本帮助中能够正确显示),用户需先下载并安装Surrogate Package Surrogate程序包

Microsoft 在中文简体版Office XP及相应多语言包中,专门开发了超大字符集中文字体(宋体-方正超大字符集)及增强型区位码。要安装宋体-方正超大字符集,请在安装界面上选择Office共享功能–>中文字体–>中文超大字符集字体。如果您是从多语言包进行安装,请在安装界面上选择Office Shared Features–>Chinese fonts–>Chinese Extended font。宋体-方正超大字符集字体包括了上面提到的全部27,564个汉字以及在第二平面中(42,711)选出的36,862个在中国大陆、香港特别行政区(以及部分台湾地区)使用的汉字,因此包括西文等常用字符在内,宋体-方正超大字符集共包括65,531个字符。

——取自微软《增强型区位码输入法5.1帮助》

在Word 2002中文版中,专门开发了6.4万字的超大字符集中文字体,即宋体—方正超大字符集(Sursong)。该字体与增强型区位码配套使用,用户须自行下载Surrogate模块,否则只能处理双字节编码汉字,至于ISO 10646第二平面的扩展B汉字无法显示和输入。除了使用增强型区位码输入法的Unicode/外字输入四字节的Surrogate码,还可以直接在Word 2002中输入双字节或四字节的Unicode码(前面字节为0可省略),然后按Alt+X转换成汉字(图21)。在增强型区位码输入法的帮助中,有关码表按照《康熙字典》的页码排列,同时对照《汉语大字典》的页码。

——取自拙作《XP中文之旅㈦:Word 2000/2002中文深入应用》

Surrogate更新链接:
http://www.microsoft.com/downloa ... p;DisplayLang=zh-cn

说明
注意:增强型区位码输入法只在中文简体版Office XP(以及简体语言包)中发放。……在缺省安装情况下,增强型区位码输入法是不被安装的。

针对超大字符集字体的识别,该支持包将字体名称写入注册表。在当前的支持包中,我们写入的字体名称就是在中文Office XP 中的超大字符集字体。如果用户想安装并使用自己的超大字符集字体,请在将字体名称填写到下面注册相中

[HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\International\Scripts\42]

IEFixedFontName=[Surrogate Font Face Name]

IEPropFontName=[Surrogate Font Face Name]

如何卸载
该组件没有卸载功能。

另外,谢谢自在兄给我发短消息。您过奖了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

 

ADVERTISEMENT



ADVERTISEMENT



ADVERTISEMENT

ADVERTISEMENT


版权所有 © 1996-2023 Cari Internet Sdn Bhd (483575-W)|IPSERVERONE 提供云主机|广告刊登|关于我们|私隐权|免控|投诉|联络|脸书|佳礼资讯网

GMT+8, 14-2-2025 09:28 PM , Processed in 0.117075 second(s), 24 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表