[发明专利]汉字抽剥字形编码无效
申请号: | 89105723.4 | 申请日: | 1989-05-11 |
公开(公告)号: | CN1047405A | 公开(公告)日: | 1990-11-28 |
发明(设计)人: | 李挺进 | 申请(专利权)人: | 李挺进 |
主分类号: | G06F3/00 | 分类号: | G06F3/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 湖南省大庸*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汉字 字形 编码 | ||
本发明涉及一种汉字字形编码方法,用于电子计算机中文处理以及汉字检索等领域。
电子计算机汉字输入编码和汉字检索编码方法(以下称编码)可归类为字音编码,字形编码和音形结合编码三大类型,以汉字字形为编码对象的字形编码是比较理想的一类,因为:汉字的本质是拼形而非拼音,字形编码适合汉字使用者的视觉习惯和记忆心理,编码与字音无关,对读不出或读不准确音的字能照常编码,这对于多同音字和地方音的汉语是极为重要的。
现有的字形编码方案中,较有影响的诸如“四角号码查字法”,陈爱文“汉字表形符号编码”,王永民“五笔汉字输入法”,钱伟长“汉字宏观字形编码”,团国兴“汉字简易选字输入法”(CN:85100919),支秉彝“见字识码”,台湾胡立人“三角编码”等各有所长,但都在某些方面存在明显缺陷,这些缺陷主要有:
1.基本构件(字根)划分过分牵强或抽象,缺乏一致的,必然的逻辑联系,繁多的字根令人望而生畏;
2.字根代码与字根之间缺乏关联规律,或规律复杂,很难辨别;
3.没有一贯的和简易的编码规则;
4.重码字组多,每组重码字数多,重码字处理方法不简便;
5.编码顺序受传统笔画笔顺过多制约,有相当数量的例外字笔顺难以判别,给编码带来困难;
6.字根不可读,难以记忆和交流。
本发明的任务是:提供一种汉字字形编码方法,以汉字字母(或其代码)为单位对汉字进行编码,这种字码既能用于电子计算机的中文信息处理,又能用于汉字的一般检索,还可用来表达汉字结构。同现有的技术相比,本发明有如下主要优点:
1.字码单义,重码字组,字数都较少;
2.规则一贯制,逻辑性强,记忆量极少,只需掌握44个汉字字母和字母间结合的5种位型,便能见字识码;
3.覆盖全部汉字,对生僻字亦不需特殊对待;
4.字码位数少,常用字字码都是2-3位;
5.字母可读,字母与其相近的汉字有密切的关联,字母及其大,中,异3种形态等概念均属首创,使人易记易辨,举一反三;
6.字母用与其读音对应的拉丁字母作代码(包括2个位型代码),这种简单关系使人见到字母便知代码,使中文处理真正堪与西文媲美;
7.重码处理方法简单自然;
8.本法对汉字的简化有参考作用。
下面将结合图表对本发明完成上述任务的方法作详细说明。
几个概念:
汉字的基本笔画称为字元(简称元)。字元(或部件)间的位置关系称为位型,由若干字元按一定部位组成的二维序列,称为部件,字元间的交接位置称为连离点。
由表1知,字元有“横”,“竖”,“撇”,“捺”等4种。
由表2知,字元间部位有“交”,“围”,“连”,“粘”,“离”等5种位型,而部件间有“纵”,“横”,“围”等3种位型。
由1个字元同3个或3个以上字元“交”所组成的部件,称有筋部件,这个单元或连同与它相“连”的其它元组成的部件,称为筋。由2个以上元“连”而形成的可以对其它部件构成两面以上包围的部件,称为皮(如“尸”,“口”),皮连同被包部件构成有皮部件。
有筋贯穿的字称有筋字,有皮在最外层的字称有皮字。例:
有筋字:册,事,申,夷,车,电
有皮字:区,国,凶,司,用,且
选取汉字中使用频繁的部件作为基本部件或字根,按形似予以分组,定义每个组为一个汉字字母,每个字母包含1-3个字根(简称件),称为该字母的大写,小写和异写件,每个字母以与其大写件相同或相近的简单汉字的音为它的读音。表3,列出了本法定义的44组字母及其代码。
任何单个汉字(简称字)均由一定数量的件按一定位型组成的二维序列字的分类见表6。字母件本身也由一些含元较少的其它件组成。
由1个,2个,3个或3个以上件组成的汉字(或字母件)分别称为单件,双件,三件或多件字(或字母件)。只有一个字元的件称为单元件,由两个字元组成的部件称为双元件。
字的最左(对横列字),上(对合字或纵叠字)位置上的字元,称为主码基元,与主码基元相邻的元称主邻元;最右(对横列字),下(对合字或纵叠字)方位置上的字元,称为辅码基元,包含主(辅)码基元的件称主(辅)件;与辅件相邻的元(件)称辅邻元(件),被辅件包围的元(件)称辅包元(件)。单件字只有主码基元,双件字没有邻基元。主码基元,辅码基元和辅邻或包元通称基元,与基元相邻的元称为基邻元。
用表3中的字母各件作编码单元的字码,称为汉字抽剥编码,简称抽剥汉码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李挺进,未经李挺进许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/89105723.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:摩擦焊
- 下一篇:三烷和缩水甘油酯的衍生物的新的聚乙缩醛共聚物