[发明专利]一种无字库的汉字智能生成方法有效

专利信息
申请号: 201010263032.2 申请日: 2010-08-25
公开(公告)号: CN101930299A 公开(公告)日: 2010-12-29
发明(设计)人: 皮佑国;段骋森 申请(专利权)人: 华南理工大学
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 杨晓松
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 字库 汉字 智能 生成 方法
【说明书】:

技术领域

本发明属于信息技术领域,涉及一种计算机的无字库汉字智能生成方法。

背景技术

目前,各种计算机操作系统中的中文信息处理采用的是汉字字库方式。存在着(1)难以建立长期稳定的汉字信息化标准;(2)不符合汉字的造字规律,影响对文化的传承;(3)与汉字教学脱节,极大地浪费了社会资源;(4)无法很好的满足整个社会的应用需求,许多汉字无法进入计算机;(5)信息熵高,是效率最低的文字信息系统。

针对汉字字库存在的弊端,许多有识之士探索着解决的途径和方法,对汉字生成技术进行了研究与探讨,一些运用笔画或组件来生成汉字的方法应运而生。

公开号为CN 1277377A,公开日为2000年12月20日的中国发明专利公开了一种“汉字字形自动生成方法及其装置”。该发明将汉字表示成以汉字部件为操作数,将汉字部件设计成512个并分成独立、左右、上下和包围4类。部件间结构关系为基于运算符号的数学表达式,分别用lr/ud/ld/lu/ru/le/re/ue/de/we十种算符来表示部件之间的结构关系。将上述部件编码和结构关系存入专用控制卡中,从专用控制卡中读取工作环境参数,并抽取汉字表达式,再按汉字笔画抽取方法抽取所述512个汉字部件笔画端点坐标、判断笔画类型,生成汉字框架。笔画生成采用B样条函数,形成汉字字形。该专利对部件本身的结构来进行分类(4类),又对部件之间的关系(结构)来进行描述,既不符合汉字学的思想,又繁琐重复;生成汉字采用笔画,复杂繁难,仍然依赖于汉字字库。

公开号为CN 1294357A,公开日为2001年5月9日的中国发明专利公开了一种“汉字笔画造字法”。该发明以形声字的造字规律,由五种基本笔画组成汉字的原理,采用递归定义算法,将汉字归纳为52个中文字母字,并用全息汉字表达式来自动生成各种字体和字型。但52个中文字母字没有汉字文化依据,笔画组成原理繁难;递归算法和全息表达式虽然可以描述汉字,但复杂繁难,难以推广使用,而且仍然需要汉字字库。

已授权发明专利“汉字电子化中的拼部组字方法”(CN1253781C)所公开的是一种智能造字的方法,该方法认为汉字由汉字成分组成,所有汉字成分都是汉字基元在不同汉字结构中的拓扑变换;而汉字基元是汉字的基本元素,主要由象形指事字及其符号构成,反映了汉字的表意特征。而发明人的另一发明专利申请“一种基于结构和基元的汉字编码输入方法”(CN101551711A)在前一专利CN1253781C的基础上解决了汉字结构和基元编码问题,提出汉字可划分成整体、左右等17种结构。汉字是方块文字,汉字及其基元都可以作出其外接矩形。汉字成分(即汉字各级结构及各个基元)构成的外接矩形之间的几何图形位置是汉字的结构。与拼音文字(word)中字母的大小和形态一致不同,同一基元在不同汉字中的大小、位置和形态都可能不同。虽然通过拓扑变换可以解决同一基元在不同汉字中的大小、位置和形态有所不同的问题,但在CN101551711A专利申请中尚未解决如何根据编码来实现智能造字中的上述变换参数的推导问题。

发明内容

本发明的目的在于克服现有技术的缺点与不足,提供一种无字库的汉字智能生成方法,解决了如何根据基于“一种基于结构和基元的汉字编码输入方法”(CN101551711A)中未能解决的通过输入汉字编码来确定组成汉字的各个组成成分的外接矩形的定位尺寸和矩形尺寸的问题,对编码所规定的基元进行拓扑变换而实现智能造字。汉字是不断发展的大字符集,新的汉字将会不断产生,本发明是通过已有汉字的基元变换知识来推求新出现的汉字中的基元变换知识,因此可以没有字库而只有基元库,通过输入的汉字编码自动地生成汉字,从而实现真正意义上的智能造字。

本发明通过以下技术方案来实现上述目的:本无字库的汉字智能生成方法,通过汉字的编码自动地生成汉字,这一过程包括以下步骤:

S1、根据输入的汉字编码,获得汉字的结构树;

S2、根据汉字的结构树,构造由汉字各级结构及各个基元的外接矩形组成的拼图;

S3、确定汉字各级结构的外接矩形的的位置和形状;确定各个基元在目标汉字中的外接矩形的位置和形状;

S4、根据步骤S3得到的各个基元在目标汉字中的外接矩形的位置和形状,确定拓扑变换系数;

S5、利用拓扑变换方法和步骤S4获得的拓扑变换系数,将汉字基元变换到目标汉字中去,完成目标汉字中各级结构及各个基元的变换。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010263032.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top