[发明专利]一种汉字拆分处理方法无效
申请号: | 95105981.5 | 申请日: | 1995-06-07 |
公开(公告)号: | CN1152143A | 公开(公告)日: | 1997-06-18 |
发明(设计)人: | 林兵 | 申请(专利权)人: | 林兵 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100044 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 汉字 拆分 处理 方法 | ||
1.一种汉字拆分处理方法,其特征是对于在汉字拆分过程中产生的、汉字标准字符集中没有收入的非标准汉字部件,使用转义符号加上一个标准字符来表示,同时对于可以拆分,也可以不拆分的字根、部件、汉字进行兼容处理。
2.按照权利要求1的方法,其特征是采用下列步骤:
(1).选定一个或若干个转义符号;
(2).对汉字字符集中的汉字进行拆分,搜集出现的非标准部件字符;
(3).为每一个非标准字符选定一个对应的标准字符;
(4).制作标准字符与非标准字符的对应表;
(5).凡是出现非标准字符的场合均使用转义符号加上其对应的标准字符来表示。图1。
3.按照权利要求2的方法,其特征是所说的转义字符是计算机信息交换用标准字符集合中的符号。
4.按照权利要求2的方法,其特征是所说的若干个转义字符可以分别表示非标准部件字符与对应的标准字符的字形关系,包括字形相似、字形变体、字形包含、左部件、右部件、上部件、下部件等等。
5.按照权利要求2的方法,其特征是在为非标准部件字符选择替代用标准字符时,考虑两者的相互关系,包括字形相似、同源变体、字形包含、常用、首部件等等因素。
6.按照权利要求2的方法,其特征是所说的出现非标准字符的场合包括计算机软硬件系统内部信息交换、字符显示、字符打印等。
7.按照权利要求1的方法,其特征是在对汉字拆分处理时,根据字形结构、组字频度等特点,把标准汉字字符和非标准汉字字符分为以下三种情况:
(1).基本部件:包括常用字根部件、结构紧密的单体字;
(2).复合部件:包括可以作为组字部件,组字频度较高的字根、部件、汉字;
(3).合体字:结构分明的多体字。图2。
8.按照权利要求7的方法,其特征是采用下列步骤:
(1).对基本部件不拆分,作为一个整体,提取特征,形成一组特征描述代码;图3;
(2).对复合部件可拆也可不拆,不拆分时,作为一个整体,提取特征,形成一组特征描述代码;拆分时,把它拆成n个部件,可以提取出n组特征描述代码;图4;
(3).对合体字拆分,把它拆成n个部件,可以提取出n组特征描述代码;如果其中包含复合部件,分别按拆分和不拆分两种情况处理;图5。
9.按照权利要求8的方法,其特征是对于复合部件,在作为一个整体提取特征时,可以分别从n个部件中提取特征,形成一组特征描述代码。
10.按照权利要求1至9任何一条的方法,可以应用到各种计算机中文信息处理的软硬件系统,以及各种印刷出版物中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于林兵,未经林兵许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/95105981.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无线尿液检知器
- 下一篇:用于卡车等的紧急制动装置