[其他]中文字词语从形编码法及其所用键盘无效

专利信息
申请号: 86103490 申请日: 1986-05-20
公开(公告)号: CN86103490B 公开(公告)日: 1988-07-27
发明(设计)人: 黄美陶 申请(专利权)人: 黄美陶
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 湖北省专利事务所 代理人: 刘克钺
地址: 湖北省武汉市*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文字 词语 编码 及其 所用 键盘
【说明书】:

本发明属于电子计算机及其他类似设备处理中文信息的技术领域。

目前国内外利用电子计算机等设备处理中文信息。一般采用对汉字进行逐字编码输入(在通用小键盘上)或整字逐字输入(在特制的大、中型键盘上)的方案。对汉字的逐字编码的方法,包括拼音法、音形结合法、笔划拼形法、部件笔划拼形法等四种。前两种方法在输入不认识的汉字,或读音不准时,就感到困难,而且相同读音的字太多,选择起来很费时间。笔划拼形法虽然部件或笔形较少,但要将汉字拆分得很细,容易出错,且汉字平均击键次数高。部件笔划拼形编码法(如苍吉码、五笔字形输入法、宏观字形简易输入法以及85104343号专利申请所公布的汉字编码法)采用偏旁部首和笔划组合选作部件,使平均击键数有所减少,输入速度有了提高,但均存在着所用部件多(100个左右),涉及的规则和概念复杂,学成较慢,且无法将所用笔划或部件较为清晰地全部刻于键帽上,使操作和记忆不甚方便。至于整字输入方式,虽使输入操作较为直观。每个字平均击键次数降低,但它要求对通用的计算机等设备的硬设备进行相应的添加或改制。另作中、大型键盘,势必增加设备的购置费用,同时在选取所需汉字时,无疑要花费较多时间,仍使输入速度难以提高。

对汉字的逐字编码输入或整字输入难以提高中文信息的处理速度,使人们不能不考虑“以词为单位”。“词”本是世界上大多数国家的文字构成单位。我国的汉字发展到现在,亦已大部分演变成“词素”,由一个单音节的“字”具备有词的作用的已为极少数,如去年出版的十万词的《现代汉语词表》里,只有约2000个单音节的词,由单音节的词发展到多音节的词是语言文字进化的规律。

本发明旨在撇开对汉字的逐字编码输入和整字输入的方式,而提供一种对全体中文字词语进行编码的易学、好记、适用的词语从形编码方法及其所用键盘,以大大加快输入速度,提高计算机处理中文信息的能力。

根据本发明,对中文字、词汇、成语(包括谚语、歇后语等)分成“一字词”、“二字词”、“三字及三字以上词语”、“由两个句组成的语句”、“无习惯已简缩词语”(指三个或三个以上常用词所组成的复合词)、“有习惯已简缩词语”诸种情况分别规定其取码的字及其部位,每应取码的部位取决于对该汉字的拆分;对汉字的拆分按“块分排、层,*落分层(指不用笔顺),择大录取”(“大”指高频字简码、部件或复笔形)的原则进行(在本发明中除高频字简码、“一字词”用“对字编码”的拆形法外,一般只涉及字的“首”、“底”部分);各汉字按上述规则被拆分成一定的部件或笔形;每个部件或笔形被赋予于一个字母,同组部件和笔形被赋于相同的字母;本发明中所标称的部件约28个,基本笔形为7种,复笔形为12种,经优化选择综合为26组;每组部件或笔形对应于键盘上的一个字母键;按照上述方法,每一个中文字词语被赋于其特定的一个至数个字母组成的字母串。

下面结合附图对本发明加以详细说明。

图1示出了本发明使用的28个部件、7种基本笔形和12种复笔形,它们的分组情况,每组部件和笔形与英文字母的对应关系,以及每个高频字简码(本发明中为21个高频字)所对应的字母。

图2为本发明所使用的键盘键帽示意图。

图3是几个编码实例,说明了对不同情况采用的编码方法,即取码位置。

按照本发明,依“块分排、层,*落分层,择大录取”的原则,对应编码的汉字进行拆分。所谓块分排、层,是指根据汉字的结构加以分排:、分层:(汉字结构实际上很复杂,存在多种多样的块列形式,本发明中概括为这两种);所谓*落分层,是指按字的形状加以分层拆开,而不按笔顺处理;所谓择大录取。是指对高频字不拆分,能拆分为部件的不再拆分成复笔形或基本笔形,能拆分为复笔形的不再拆分成基本笔形。在本发明中,除高频字简码在编码时应直接取其本身。“一字词”采取对字编码“(即对字拆形编码)”以外,一般涉及取码的部位只有“首”、“底”两部分。“首”指字的左上部分,“底”指字的右下部分。

由于本发明是对汉语的全部词语进行编码,须按词语所含字数的多少,分别规定其取码的位置:

对“一字词”,如系高频字简码,直接取用,否则采取“对字编码,”即对字拆形编码方法;

对“二字词”,采取按各字的“首”、“底”部位依次分别取码,这样,“二字词”最多编为4码;

对“三字和三字以上的词语”,采取第一字取“首”、从第二至第四各字取“底”,再跳取末一字的“底”码,这样“三字和三字以上的词语”最多编为5码;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黄美陶,未经黄美陶许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/86103490/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top