[发明专利]汉字子汉字码计算机输入系统无效
申请号: | 97112675.5 | 申请日: | 1997-07-09 |
公开(公告)号: | CN1186977A | 公开(公告)日: | 1998-07-08 |
发明(设计)人: | 邱励楠;邱行中 | 申请(专利权)人: | 邱励楠 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518035 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汉字 计算机 输入 系统 | ||
本发明涉及汉字编码及其计算机输入系统。
目前汉字编码方法很多,已经在计算机上使用的汉字编码方法有几十种,其中包括最常见的拼音码、首尾码、五笔字型码、大众码和表形码等。这些编码都未能很好地同时解决汉字拆码的简易性、汉字输入的快速性和编码方法易记易学三方面的矛盾。例如拼音码,虽然简单易学,但重码率高,输入速度慢。首尾码、五笔字型码、大众码和表形码等虽能实现汉字的快速输入,但汉字拆码难,部件或字根难以记忆。最近出现的自然码,是在双拼法基础上发展起来的,它采用以词为主导、字词混合的编码方法,其汉字输入速度更高。但是这种编码方法仍然存在汉字不易拆码、部件多、难以记忆等缺点。
本发明的汉字编码及其计算机输入系统是通过选择汉字中包含的子汉字对汉字拆分,然后采用声码、韵码和形码中的各种码或部分码对汉字和汉字拆分后的部分(以下统称为子部)编码,再进行汉字输入。这样可以使汉字拆分变得十分简单,因此彻底克服了许多编码方法中存在的汉字难拆分、部件多、难记忆等缺点。对于熟练掌握、一般掌握和完全不懂汉语拼音的人,都能做到汉字拆分容易、编码方法简单、易记易学、重码率低,可在计算机通用小键盘上实现汉字的高速度输入。
下面对本发明进行详细说明。
按汉字拆分成的子部数目不同,本发明的编码体系可分为两分体系(汉字最多拆分成两部分)、三分体系(汉字最多拆分成三部分)和四分体系(汉字最多拆分成四部分)。对于不同的编码体系,有不同的编码方法。在每种体系中,可分为以10个数字或10个英文字母为码元的全形码法和以26英文字母为码元的四位码长形码法。前者又分为五位码长法和六位码长法,后者又分为全形码法和部分形码法。本发明提供了多种编码方法,可采用任何一种方法对所有汉字和词组进行编码。
子汉字是指汉字本身或子部中所包含的由最大部分构成的汉字。我们规定交式单体字不拆分,因此交式单体字不包含子汉字。另外,我们规定汉字“一”不是子汉字,因此“一”不作为子汉字参与对汉字的拆分。
本发明对汉字的拆分原则是:
1.按照二分体系或三分体系或四分体系将汉字最多拆分成二或三或四部分。如将“辞”拆分成两部分时,为“舌”和“辛”,拆分成三部分时,为“舌”、立”和“十”,拆分成四部分时,为“千”、“口”、“立”和“十”。
2.按照二分体系或三分体系或四分体系将汉字尽量拆分成二或三或四部分。如在四分体系中,“许”拆分成“”、“”、“一”和“十”四部分。
3.汉字拆分时,尽量先取最大的部分作为子汉字,如有需要,子汉字还可继续拆分。如“暮”先拆分成“莫”和“日”,在三分和四分体系中,“莫”再逐步拆分出“大”、“日”。“熊”也类似。
4.汉字中的子汉字尽可能多地参与编码。如“赣”拆分成四部分时,先拆分出“章”后,再从其右半部拆分出“贡”。
5.除相交笔画外,所有汉字都按笔画顺序进行拆分。如从“产”的前部分拆分出子汉字“立”,而不从后部分拆分出子汉字“厂”。
6.汉字尽可能多地拆分出子汉字。例如在四分体系中,“躁”拆分成“口”、“止”、“品”和“木”。“檐”拆分出“木”、“八”和“言”,而不是拆分出“木”和“厂”。
汉字本身、第一子部和第二子部等都可有形码,分别记为形01、形02、形11、形12、形21和形22等。汉字本身可有声码、韵码,子汉字可有声码,它们可分别记为声0、韵0、声1、声2等,分别表示汉字声码、韵码和第一、第二子部的声码等。
二分体系中汉字的拆分方法
在二分体系中,通过选择汉字的字首或字尾部分(当字首不存在子汉字时)的子汉字对汉字拆分,并按汉字是否可拆分,将汉字分为单部字和双部字,然后采用声码、韵码和形码中的各种码或部分码对汉字和汉字拆分后的子部进行编码。
1.单部字:具有下列特征的汉字为单部字。
(1)交式单体字,如东、未、申、中、串和丰等。
(2)不能拆分出子汉字的连或散式单体字,如心、瓜、爪和予等。
(3)不能拆分出子汉字的双体字或多体字,如卵、扎和巡等。
(4)仅中间部分可拆分出子汉字的汉字,例如烹、羔。
2.双部字:具有下列特征的汉字为双部字。
(1)至少字首部分为子汉字的连式或散式单体字,如父、太、今、令、矛、产、名、易、星、岁和尽等。“太”拆分为“大”和“”,“尽”可拆分为“尺”和“”。
(2)仅字尾部分为子汉字的连式或散式单体字,如白、亚、亘等,“白”拆分为“”和“日”,“亘”拆分为“一”和“旦”。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邱励楠,未经邱励楠许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/97112675.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:势能680000千瓦发电机
- 下一篇:可吸附容器