[其他]中文字词语从形编码法及其所用键盘无效
申请号: | 86103490 | 申请日: | 1986-05-20 |
公开(公告)号: | CN86103490B | 公开(公告)日: | 1988-07-27 |
发明(设计)人: | 黄美陶 | 申请(专利权)人: | 黄美陶 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 湖北省专利事务所 | 代理人: | 刘克钺 |
地址: | 湖北省武汉市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 词语 编码 及其 所用 键盘 | ||
本发明属于电子计算机及其他类似设备处理中文信息的技术领域。
目前国内外利用电子计算机等设备处理中文信息。一般采用对汉字进行逐字编码输入(在通用小键盘上)或整字逐字输入(在特制的大、中型键盘上)的方案。对汉字的逐字编码的方法,包括拼音法、音形结合法、笔划拼形法、部件笔划拼形法等四种。前两种方法在输入不认识的汉字,或读音不准时,就感到困难,而且相同读音的字太多,选择起来很费时间。笔划拼形法虽然部件或笔形较少,但要将汉字拆分得很细,容易出错,且汉字平均击键次数高。部件笔划拼形编码法(如苍吉码、五笔字形输入法、宏观字形简易输入法以及85104343号专利申请所公布的汉字编码法)采用偏旁部首和笔划组合选作部件,使平均击键数有所减少,输入速度有了提高,但均存在着所用部件多(100个左右),涉及的规则和概念复杂,学成较慢,且无法将所用笔划或部件较为清晰地全部刻于键帽上,使操作和记忆不甚方便。至于整字输入方式,虽使输入操作较为直观。每个字平均击键次数降低,但它要求对通用的计算机等设备的硬设备进行相应的添加或改制。另作中、大型键盘,势必增加设备的购置费用,同时在选取所需汉字时,无疑要花费较多时间,仍使输入速度难以提高。
对汉字的逐字编码输入或整字输入难以提高中文信息的处理速度,使人们不能不考虑“以词为单位”。“词”本是世界上大多数国家的文字构成单位。我国的汉字发展到现在,亦已大部分演变成“词素”,由一个单音节的“字”具备有词的作用的已为极少数,如去年出版的十万词的《现代汉语词表》里,只有约2000个单音节的词,由单音节的词发展到多音节的词是语言文字进化的规律。
本发明旨在撇开对汉字的逐字编码输入和整字输入的方式,而提供一种对全体中文字词语进行编码的易学、好记、适用的词语从形编码方法及其所用键盘,以大大加快输入速度,提高计算机处理中文信息的能力。
根据本发明,对中文字、词汇、成语(包括谚语、歇后语等)分成“一字词”、“二字词”、“三字及三字以上词语”、“由两个句组成的语句”、“无习惯已简缩词语”(指三个或三个以上常用词所组成的复合词)、“有习惯已简缩词语”诸种情况分别规定其取码的字及其部位,每应取码的部位取决于对该汉字的拆分;对汉字的拆分按“块分排、层,*落分层(指不用笔顺),择大录取”(“大”指高频字简码、部件或复笔形)的原则进行(在本发明中除高频字简码、“一字词”用“对字编码”的拆形法外,一般只涉及字的“首”、“底”部分);各汉字按上述规则被拆分成一定的部件或笔形;每个部件或笔形被赋予于一个字母,同组部件和笔形被赋于相同的字母;本发明中所标称的部件约28个,基本笔形为7种,复笔形为12种,经优化选择综合为26组;每组部件或笔形对应于键盘上的一个字母键;按照上述方法,每一个中文字词语被赋于其特定的一个至数个字母组成的字母串。
下面结合附图对本发明加以详细说明。
图1示出了本发明使用的28个部件、7种基本笔形和12种复笔形,它们的分组情况,每组部件和笔形与英文字母的对应关系,以及每个高频字简码(本发明中为21个高频字)所对应的字母。
图2为本发明所使用的键盘键帽示意图。
图3是几个编码实例,说明了对不同情况采用的编码方法,即取码位置。
按照本发明,依“块分排、层,*落分层,择大录取”的原则,对应编码的汉字进行拆分。所谓块分排、层,是指根据汉字的结构加以分排:、分层:(汉字结构实际上很复杂,存在多种多样的块列形式,本发明中概括为这两种);所谓*落分层,是指按字的形状加以分层拆开,而不按笔顺处理;所谓择大录取。是指对高频字不拆分,能拆分为部件的不再拆分成复笔形或基本笔形,能拆分为复笔形的不再拆分成基本笔形。在本发明中,除高频字简码在编码时应直接取其本身。“一字词”采取对字编码“(即对字拆形编码)”以外,一般涉及取码的部位只有“首”、“底”两部分。“首”指字的左上部分,“底”指字的右下部分。
由于本发明是对汉语的全部词语进行编码,须按词语所含字数的多少,分别规定其取码的位置:
对“一字词”,如系高频字简码,直接取用,否则采取“对字编码,”即对字拆形编码方法;
对“二字词”,采取按各字的“首”、“底”部位依次分别取码,这样,“二字词”最多编为4码;
对“三字和三字以上的词语”,采取第一字取“首”、从第二至第四各字取“底”,再跳取末一字的“底”码,这样“三字和三字以上的词语”最多编为5码;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黄美陶,未经黄美陶许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/86103490/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多址通信系统
- 下一篇:簧片式开关的安装结构