[发明专利]形声复合码汉字输入方法无效
申请号: | 94112196.8 | 申请日: | 1994-06-08 |
公开(公告)号: | CN1054930C | 公开(公告)日: | 2000-07-26 |
发明(设计)人: | 张炳奎 | 申请(专利权)人: | 张炳奎 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 复旦大学专利事务所 | 代理人: | 陆飞 |
地址: | 200093 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 形声 复合 汉字输入 方法 | ||
本发明属汉字编码技术领域,是一种形声复合码。
目前汉字编码方案已达四百余种。这些方案可以分作三大类:依据汉字读音编码的音码,依据汉字字形编码的音码,以及综合考虑字音和字形编码的音形码。各种编码方案均有所长,也各有所短,它们在汉字编码的园地中百花齐放,斗奇斗艳。
音码易学易记,但重码率高,输入速度慢。因为汉字可分音节总共只有四百多个,加上声调标志也不过一千二百多个。这就不可避免地出现大量重码字。形码虽然基本上克服了重码字的障碍,却又在分解字形上搞得错综复杂。一般人很难在短时间内掌握其方法,至于各种音形码,虽然各在某些方面克服了音码、形码的缺陷,但同时却又带来许多新的问题,具有广泛运用价值的还不多。
本发明的目的在于以汉字造字最基本的形声方法为基础,提供一种可以克服音码重码率高、形码字形分解复杂之缺陷,而且编码规则简明、操作使用便捷的形声复合编码方法。
众所周知,汉字是一种由象形文字发展而成的表意文字,其造字方法主要有象形、指事、会意、形声四种,而以形声方法最常见、最有生命力。统计资料告诉我们,汉字中百分之九十以上为形声字。因此,可以说,形声字的特点就是汉字的基本特点。利用形声字的特点对汉字进行编码,是最符合汉字实际面貌和书写习惯,因而也可能是最优秀的汉字编码。
形声字的最明显的特点是可以很方便地分解成表义的形旁和表音的声旁两部分。那些非形声字,以及一些经过长期演变已失去原有面目的形声字,虽无形旁、声旁之分,或者形旁、声旁区别不明显,但依据部首和笔画,往往还是可以分解成两部分的。利用形声字的特点对汉字“一分为二”或“一分为三”是本方案的主要思想和主要做法。
本发明将构成汉字的基本笔画和部首分解和归纳成十大类七十四种字根。并分别用0~9十个阿位伯数字表示。全部汉字的编码即在此基础上产生。
汉字的读音是汉字三要素之一。在设计编码方案时充分利用汉字读音这个信息,必定会对新编码方案带来积极的作用。形声复合码在对单个汉字编码时充分考虑了汉字的读音这个要素,并将其作为那些笔画少、字形结构简单且又多是日常用字的编码的一部分。由于增添了这部分汉字的读音信息,从而为彻底消除重码现象迈出了决定性的一步。
本发明还对常有词语进行编码。由于词语和单字表现形式不同:单字仅凭读音很难确定,还要靠书写形式才能最终明确;而词语特别是双音节以上的词语,凭借读音就可作出判断。所以本方案对词语编码以读音为主要依据,而字形信息则用来区分同音词语。本方案对词语的编码,既吸收了一般音码的长处,又具有自己的特色,从而使词语的编码和输入,变得十分简便快捷。
本发明的具体方案如下:将构成汉字的所有基本笔画和部首分解为字根,并归纳为10大类共74种。对10类字根分别用0~9共10个数字码号表示。这10类字根的名称为横、竖、撇、点、折、口、叉、八、盖、合,对应的数字码号分别为:1、2、3、4、5、6、7、8、9、0。把74个字根分为基本级字根(26个)数字级字根(16个)、扩大级字根(32个),具体见如下字根表:
以上述字根及其数字码号为基础,本发明提出了汉字单字和词语的编码方法:
关于汉字单字编码。将每个汉字单字按上述字根分解,用对应的数字码组成该字码,对于笔画较少的单字,则用字根的数字码和该字的字母码组合成该字码,码数不超过4个。按单字字根的多少分为下述3种情形:
(一)少于4字根的单字,按书写顺序依次取各字根的数字码,最后再附加字母码。例:口:冂、一,91K。于:二、亅,22V。
兴:、一、八,418X。
(二)等于4字根的单字,按书写顺序依次取各字根的数字码,取足4码。例:经:纟、フ、丶、工,5541。湖:氵、十、口、月,4769。
锥:钅、亻、亠、,8303。
(三)多于4字根的单字,分为2种情形。
1、独体字,按书写顺序依次取前4个字根的数字码,其余不用。
例:承:亅、三、5235。弟:丷、丨,8052。
重:丿、一、口、一,3161。
2、合体字,合体字的构字情况较复杂,根据合体字的构字情况,本码将合体字分成三种情况处理。
(1)“二二式”,这类字由两部分构成,每一部分可以分解成两个或两个以上的字根,称为“二二式”,其编码方法是:先将单字“一分为二”,对各部分再分解成字根,然后按书写顺序分别取前、后两部分的前二个字根的数字码,合为4码。例:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张炳奎,未经张炳奎许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/94112196.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种制备氟化甲烷的方法
- 下一篇:喷墨记录设备及其驱动方法