[发明专利]一种计算机汉字动态编码输入法及其键盘无效

专利信息
申请号: 94118357.2 申请日: 1994-11-25
公开(公告)号: CN1054220C 公开(公告)日: 2000-07-05
发明(设计)人: 董书杰 申请(专利权)人: 董书杰
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 三高专利事务所 代理人: 黄厚刚
地址: 100045 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 计算机 汉字 动态 编码 输入法 及其 键盘
【说明书】:

发明属中文信息处理、汉字输入领域。

目前已有的汉字编码及输入方法基本上可以分为三类:音码、形码和混合码等。

音码多以国家颁布的汉语拼音方案为基础,简单易学,但由于重码率高、平均编码较长,在实际使用中速度慢,实用性很低。双拼方案只缩短了平均码长,而且一般的双拼要求用户同时记忆三十个韵母的键位对照表,容易使一般的汉字录入者望而生畏。形码的优点是编码短,重码率低,但既不容易学又容易忘。混合码是利用文字的多维信息如音、形、义、语法等对汉字进行编码。编码者们在权衡易学性、录入速度之后,对文字多维信息的形形色色的组合,导致了形形色色输入方法的诞生。尽管面对如此众金的编码方法,目前仍有千千万万的计算机用户在使用着古老的全拼输入法。可以说,到目前为止,还没一种大众化的、被普遍接受的实用汉字输入方法。

本发明的目的是为了克服已有输入方法中所存在的缺陷,按照所进行编码的汉字集是动态变化的这一原则,从而提供一种使用动态位置码加以区分的实用快速汉字输入方法。

下面说明本发明的基本思想。

如果一种汉字编码吟吸位置信息,那么该编码对整个汉字集而言便是有重码编码。比如,拼音码有重码,五笔字型基本上无重码。对汉字进行实用的无重码编码是困难的,如果再要求编码具有易学性,那就更加困难了。事实上,编码在理论上的重码率和编码在实际应用时所体现的重码率〔可称之为实际重码率〕不同。本方法着意编码的易学性、实用性,不去刻意降低编码在理论上的重码率,而是去尽力降低编码的实际重码率。

虽然拼音码重码率高,但人们在进行语音交流时,很少因为音的多义性而引起歧义;这主要是因为人们可以通过上下文的语意来识别同音字具体含义,但同时还有语音结构上的原因。

人们在写作或口语交流时,总是避免集中地使用具有相同声韵的字。除了修辞上的缘故,还因为过多的同声韵字堆积在一起,有碍于语意的理解。比如,若不加解释,很少有人能理解下面的文字:“海水朝朝朝朝朝朝朝落,浮云长长长长长长长消”。这使得人们在表达不同的事物时,会尽量使用不同的声韵组合。

此外,一段文字总是和一个主题有关,和该主题相关的文字会在该段文字中经常出现,某些声韵调组合所表达的常常是同一个含义。

分析一段有意义文字的注音,会发现其拼音码的重码率不是很高。这和上述事实是一致的,即人们倾向于用相同的音表达相同的字,用不同的音表达不同的字,同时表明拼音码的实际重码率要低于它的理论重码率。

实际上,人们所说的拼音码重码率高,是针对整个汉字集而言。对一段有意义的文字而言,其重码率就要低得多;换言之,针对用户当前使用的汉字子集而言,其重码率要低得多。如果引入词调整会使拼音码的重码率进一步降低。所以,如果只在用户当前使用的汉字子集空间内使用拼音码,会取得很理想的效果。

当前汉字子集,可以看做是在当前录入位置前后一定长度内出现的汉字的集合。用B表示已经出现的当前汉字子集部分,用F表示还未出现的当前汉字子集部分。于是有

         当前汉字子集=B∪F=B∪(F-B),B∩(F-B)=Φ。

由于F不能在当前得到,且随着录入长度的增长,F-B→Φ,所以我们用B来近似描述当前汉字子集。

为了表明子集中汉字的出现的先后,我们用排列的形式来书写B。B的建立过程如下:令B=Φ,若当前录入的汉字不在B中,则将该汉字插入到B的最前面;

     若当前录入的汉字在B中,则将该汉字提取到B的最前面。可见,某字的录入时间越近,它在B中的位置就越靠前。用这种方法建立的B,比单纯地记录汉字的出现,能更加精确地描述B的当前性。例如,若有文字串:

              ……A B ΓΔ A B,则,B的建立过程为:Φ,{A},{BA},{ΓBA),{ΔΓBA},{AΔΓB},{BAΔΓ}

如果不对B进行分类,那么B中元素的编码只能是位置码,但这样做没有实用价值。如果利用汉字本身的信息对B中的元素进行适当的分类,B中的元素就会分散到各子类中;分类码可做为编码的前部,在子类中的位置做为编码的后部。如果分类足够详细,可以做到每子类中只有一个B中元素,此时只需分类码,无需位置码。由于所进行的编码的汉字子集是动态变化的,所以在每个子类中,如果元素个数不唯一,只有使用位置码加以区分,才使得编码具有通用性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于董书杰,未经董书杰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/94118357.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top