[发明专利]一种计算机汉字动态编码输入法及其键盘无效
申请号: | 94118357.2 | 申请日: | 1994-11-25 |
公开(公告)号: | CN1054220C | 公开(公告)日: | 2000-07-05 |
发明(设计)人: | 董书杰 | 申请(专利权)人: | 董书杰 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 三高专利事务所 | 代理人: | 黄厚刚 |
地址: | 100045 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算机 汉字 动态 编码 输入法 及其 键盘 | ||
本发明属中文信息处理、汉字输入领域。
目前已有的汉字编码及输入方法基本上可以分为三类:音码、形码和混合码等。
音码多以国家颁布的汉语拼音方案为基础,简单易学,但由于重码率高、平均编码较长,在实际使用中速度慢,实用性很低。双拼方案只缩短了平均码长,而且一般的双拼要求用户同时记忆三十个韵母的键位对照表,容易使一般的汉字录入者望而生畏。形码的优点是编码短,重码率低,但既不容易学又容易忘。混合码是利用文字的多维信息如音、形、义、语法等对汉字进行编码。编码者们在权衡易学性、录入速度之后,对文字多维信息的形形色色的组合,导致了形形色色输入方法的诞生。尽管面对如此众金的编码方法,目前仍有千千万万的计算机用户在使用着古老的全拼输入法。可以说,到目前为止,还没一种大众化的、被普遍接受的实用汉字输入方法。
本发明的目的是为了克服已有输入方法中所存在的缺陷,按照所进行编码的汉字集是动态变化的这一原则,从而提供一种使用动态位置码加以区分的实用快速汉字输入方法。
下面说明本发明的基本思想。
如果一种汉字编码吟吸位置信息,那么该编码对整个汉字集而言便是有重码编码。比如,拼音码有重码,五笔字型基本上无重码。对汉字进行实用的无重码编码是困难的,如果再要求编码具有易学性,那就更加困难了。事实上,编码在理论上的重码率和编码在实际应用时所体现的重码率〔可称之为实际重码率〕不同。本方法着意编码的易学性、实用性,不去刻意降低编码在理论上的重码率,而是去尽力降低编码的实际重码率。
虽然拼音码重码率高,但人们在进行语音交流时,很少因为音的多义性而引起歧义;这主要是因为人们可以通过上下文的语意来识别同音字具体含义,但同时还有语音结构上的原因。
人们在写作或口语交流时,总是避免集中地使用具有相同声韵的字。除了修辞上的缘故,还因为过多的同声韵字堆积在一起,有碍于语意的理解。比如,若不加解释,很少有人能理解下面的文字:“海水朝朝朝朝朝朝朝落,浮云长长长长长长长消”。这使得人们在表达不同的事物时,会尽量使用不同的声韵组合。
此外,一段文字总是和一个主题有关,和该主题相关的文字会在该段文字中经常出现,某些声韵调组合所表达的常常是同一个含义。
分析一段有意义文字的注音,会发现其拼音码的重码率不是很高。这和上述事实是一致的,即人们倾向于用相同的音表达相同的字,用不同的音表达不同的字,同时表明拼音码的实际重码率要低于它的理论重码率。
实际上,人们所说的拼音码重码率高,是针对整个汉字集而言。对一段有意义的文字而言,其重码率就要低得多;换言之,针对用户当前使用的汉字子集而言,其重码率要低得多。如果引入词调整会使拼音码的重码率进一步降低。所以,如果只在用户当前使用的汉字子集空间内使用拼音码,会取得很理想的效果。
当前汉字子集,可以看做是在当前录入位置前后一定长度内出现的汉字的集合。用B表示已经出现的当前汉字子集部分,用F表示还未出现的当前汉字子集部分。于是有
当前汉字子集=B∪F=B∪(F-B),B∩(F-B)=Φ。
由于F不能在当前得到,且随着录入长度的增长,F-B→Φ,所以我们用B来近似描述当前汉字子集。
为了表明子集中汉字的出现的先后,我们用排列的形式来书写B。B的建立过程如下:令B=Φ,若当前录入的汉字不在B中,则将该汉字插入到B的最前面;
若当前录入的汉字在B中,则将该汉字提取到B的最前面。可见,某字的录入时间越近,它在B中的位置就越靠前。用这种方法建立的B,比单纯地记录汉字的出现,能更加精确地描述B的当前性。例如,若有文字串:
……A B ΓΔ A B,则,B的建立过程为:Φ,{A},{BA},{ΓBA),{ΔΓBA},{AΔΓB},{BAΔΓ}
如果不对B进行分类,那么B中元素的编码只能是位置码,但这样做没有实用价值。如果利用汉字本身的信息对B中的元素进行适当的分类,B中的元素就会分散到各子类中;分类码可做为编码的前部,在子类中的位置做为编码的后部。如果分类足够详细,可以做到每子类中只有一个B中元素,此时只需分类码,无需位置码。由于所进行的编码的汉字子集是动态变化的,所以在每个子类中,如果元素个数不唯一,只有使用位置码加以区分,才使得编码具有通用性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于董书杰,未经董书杰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/94118357.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多项液体质量控制猪血清及制备方法
- 下一篇:一种模糊控制的高炉全自动除尘系统