[发明专利]汉字主次字元码无效
申请号: | 94117367.4 | 申请日: | 1994-10-15 |
公开(公告)号: | CN1121204A | 公开(公告)日: | 1996-04-24 |
发明(设计)人: | 李保源 | 申请(专利权)人: | 李保源 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 226002 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汉字 主次 字元 | ||
本发明涉及一种汉字音形结合式编码方案。
本发明可用于计算机的汉字输入和辞书查检汉字之用。
目前流行的各种汉字编码方案,基于汉字发音的,或者对汉语拼音知识的要求高,如自然码;或者重码多不便于使用,如拼音码。基于汉字笔型或考虑到汉字笔型的,其字元的选取个数多、不易记忆、且对字元的处理过于简单,表现为:人为割断了字元和不同汉字间的有机联系,对同一字元出现在不同汉字中的情况不加区分一视同仁;且对字元本身信息的提取也不充足,或者仅考虑其音的信息、或者仅考虑其形的信息,且重码仍有一定数量。如五笔字型须记忆130多个字元,结果重码汉字对国标‘GB2312-80信息交换用汉字编码字符集(基本集)’规定的6763个汉字仍有500多个。表形码采用了三十一个键位,重码字却为1000多个。
本发明的目的在于尽量提取能反映汉字间相互区别的音形信息,以解决计算机汉字输入过程中既要求规则简洁明了便于掌握,又要重码少以达到快速输入的效果。本发明需要记忆的字元不多,重码汉字仅400多个。
本发明的目的可以通过以下编码原则和措施来达到:一、从构成汉字的结构单元(即字元)中选取28个高频字元作为主要字元,其余结构单元均作为次要字元。次要字元的数目没有限制。规定凡由相连或相交笔画构成的汉字部件连同其附属笔画,如不是由两个或两个以上单个汉字相连而成均作为一个字元。这样在汉字中的字元一般可以由其相互间形成的自然间隙加以区分。
下面是一些字元的具体例子:
由相连或相交笔画构成的汉字部件,如:匚、口、万、臣、足、自、曲、柬、弗、也、禺、幸;
由相连或相交笔画构成、而且具有附属笔画的汉字部件,如:雨、小、火、鸟、负、辶;
笔画虽相连但由两个汉字相连而成,故不作为一个字元,如:辛、古、糸。
28个主要字元的内容及键位按排如下表所示:
表一
字元音码的提取可分以下两种情况:
(1)字元本身即为单个汉字,则其音码为其汉语拼音的第一个字母。例如:‘自’取z,‘雨’取y。字‘一’例外取h。
(2)字元本身不为单个汉字,其音码应将其置于具体汉字中加以选取。原则是通过前拼、后拼以构成笔画最少之单个汉字,然后取对应单个汉字的汉语拼音的第一个字母。可见对同一字元其音码可以不同,例如:同为‘勹’,位于汉字‘勾’、‘匍’、‘句’,‘包’中时分别取g、p、j、b。
为减少拼读,为下述几个常用部首:‘刂、冫、囗、彡、卩、饣、礻、廾、廴、灬、夂、攵’规定了音码,具体如下表:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李保源,未经李保源许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/94117367.4/2.html,转载请声明来源钻瓜专利网。