[发明专利]汉字数码无效
申请号: | 01107250.4 | 申请日: | 2001-03-15 |
公开(公告)号: | CN1313546A | 公开(公告)日: | 2001-09-19 |
发明(设计)人: | 钟林 | 申请(专利权)人: | 钟林 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610016 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汉字 数码 | ||
本发明是一种汉字及词语的编码方法,属于汉字信息处理技术领域。
现有的汉字编码对汉字的分解有三种方法:
一、将汉字分解为笔画;
二、将汉字分解为部件;
三、将汉字分解为笔画和为数不多的部件。
方法一的制约因素是汉字平均笔画数较多和各种笔画分布极不均匀;方法二的制约因素是汉字部件种类较多、汉字构成部件较少及部件转化为符号困难;方法三虽然较前两种方法优越,但仍未摆脱上述因素的制约,同样存在编码规则不规范、随意性强、记忆点多等缺陷。
本专利发明人通过研究汉字的结构规律,发现了汉字字母。这一汉字字母集具有以下特性:
一、字母集能拼出大汉字集的全部汉字;
二、字母集只需很少的记忆量;
三、字母集有利于识字教育;
四、字母集为优化汉字编码提供了条件。
在此基础上,本专利发明人发明了将汉字字母转化为数码的方法,从而构建成了汉字字母符号系统。这一字母符号集具有以下特性:
一、符号集只用十个数字就能表示出全部汉字字母;
二、符号集利用数字的有序性实现了字母的有序性。
上述发明虽然实现了汉字的字母化和数字化,但仍存在以下两个问题:
一、汉字分解为字母不具有唯一性;
二、汉字的字母及数码序列长度分布极不均匀,短至一位,长至一二十位。
为解决上述问题,本专利发明人将字母的固定组合定义为字块,提出了字块笔画构成字母的方法,从而保证了汉字分解为字母的唯一性。根据构成汉字的字块数目,将汉字分为独体字和合体字,再将合体字分为字首和字身,并从中提取出能代表汉字主要特征的数码,从而将汉字数码及二三字词组控制在六位数字以内,并保证了重码率不因数码的缩短而明显地上升。
本专利发明人还提出了加码和减码方法,彻底解决了汉字编码的重码问题,并实现了汉字和词语混合编码不重码。
经过对国家标准《信息交换用汉字编码字符集基本集》(GB2312-80)6763个汉字、《汉字键盘输入通用词语集》(GB/T 15732-1995)43540个词语、《信息处理用现代汉语常用词表》36410个词语以及《现代汉语词典》中大部分词语的不重码编码统计,编码数字在汉字及词语数码首位和其他各位的分布是比较均匀的,最长数码不超过八位,其中有近98%的汉字及词语数码长度不超过六位(与上述汉字及词语集相应的英语词语,不超过六个字母的不到30%左右,最长的达十几个)。因此本汉字编码在各种汉字编码方案中居于领先水平。
本汉字数码方案具体说明如下:
本方案的基本思路是:词语由汉字组成,汉字由字块组成,字块由字母组成,字母由笔画组成。从笔画的形状位置特征入手,通过一种简单的形数转换方法,将字母转换成字母数码,再由字母数码组合成汉字数码和词语数码。
本方案提出了汉字分解与组合的方法、字母转换为数码的方法和汉字及词语与数码相互转换的方法。
一、汉字字母
汉字字母主要由一个笔画或两个笔画构成,如字母“丶、匚、刂、亻、勹、廴、冫、讠”。首尾连接的笔画整体构成字母,其笔画数不受限制,如字母“人、几、弓、已、尸、凸、凹”。
(一)笔画:构成汉字字母的笔画有横笔(一)、竖笔(丨)、撇笔(丿)、捺笔()、点笔(丶)、提笔()和折笔(乙 ㄋ……)。
(二)笔形:指笔画的形状。
1、笔形:笔画按方向归类为横、竖、撇、捺四种笔形,按长短分为长笔形和短笔形。
(1)横笔形:较长的横笔是长横,较短的横笔和提笔是短横。
(2)竖笔形:较长的竖笔是长竖,较短的竖笔是短竖。
(3)撇笔形:较长的撇笔是长撇,较短的撇笔是短撇。
(4)捺笔形:较长的捺笔是长捺,较短的捺笔和点笔是短捺。
钩笔是横、竖、撇、捺四种笔画的附加笔形。横笔附加钩笔构成横钩(),定义为短横;竖笔附加钩笔构成竖钩(),定义为短竖;撇笔附加钩笔构成撇钩(),定义为短撇;捺笔附加钩笔构成捺钩(),定义为短捺。折笔不是笔形,它是由上述笔形组合成的,如“乙”是由横笔、捺笔和钩笔构成。
2、特殊笔形:由若干笔画构成的形如“又、口、尸、巳、凸、凹”的封口图形,定义为口笔形。横长竖短的口笔形是长口,如汉字“昌、色、户、每、贯”中的口笔形;横短竖长的囗笔形是短口,如汉字“梅、如、辟、抱”中的口笔形,“又”定义为短口。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于钟林,未经钟林许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/01107250.4/2.html,转载请声明来源钻瓜专利网。