[发明专利]超大型汉字信息处理装置及方法无效
申请号: | 00135547.3 | 申请日: | 2000-12-18 |
公开(公告)号: | CN1359079A | 公开(公告)日: | 2002-07-17 |
发明(设计)人: | 蓝德康;郑珑 | 申请(专利权)人: | 北京中易郑码新技术有限责任公司 |
主分类号: | G06F17/00 | 分类号: | G06F17/00;G06F3/023 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 王以平 |
地址: | 100029 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 超大型 汉字 信息处理 装置 方法 | ||
本发明涉及汉字信息处理装置及方法,并且更具体地涉及能够处理十万以上汉字的超大型汉字信息处理装置及方法。
当前印刷业应用计算机进行汉字输入、编辑、排版、打印输出或发排印前胶片已经很普遍。但是,当处理的字量超过GB2312-80标准的6,763个汉字或是超出GB13000.1标准的21,003个汉字时,目前国内和国外的一些著名的、常用的排版系统都无法处理。比如《康熙字典》的字头字就有47,000多个,在释义部分,还有超出这47,000字的2000多汉字,不但用字量大,而且版式复杂。因此,无论是铅字印刷技术传入中国的100多年以来,还是现代的计算机激光照排技术,都没有解决《康熙字典》按原版式印刷的难题,只能靠照相影印。许多古籍、地方志、人名档案以及大型文献的整理和印刷出版也都如此。可以说,当前计算机印前系统处理的字量不能满足中华5000年文化发展用字的需求。
因此,随着信息化进程在各个领域,特别是在大型文献、大型科研文献、古代典藉、户籍造册等领域的加速发展,急需一种能够对两万以上汉字进行输入、编辑、排版和打印的汉字信息处理系统。
为解决上述需求,本发明的第一个目的是提供一种超大型汉字信息处理装置,它能够方便地处理十万个以上的汉字。
本发明的第二个目的是提供一种超大型汉字信息处理方法。
为实现第一个目的,本发明提供一种汉字信息处理装置,其特征在于包括:
用于接收汉字输入码的接收装置;
用于根据输入码判断待输入的汉字是标准汉字还是扩展汉字的判断装置;
第一转换和发送装置,用于在所述判断装置判断出所述汉字是标准汉字时,将所述输入码转换为所述汉字的机内码,并将所述机内码发送给文字处理模块;
第二转换和发送装置,用于在所述判断装置判断出所述汉字是扩展汉字时,将所述输入码转换为相应的扩展字库识别码和所述汉字的机内码,然后向文字处理模块发送对应于所述扩展字库识别码的字体设置命令,并且向文字处理模块发送所述机内码。
为实现第二个目的,本发明提供一种汉字信息处理方法,其特征在于包括以下步骤:
(1)接收汉字输入码;
(2)根据输入码判断待输入的汉字是标准汉字还是扩展汉字;
(3)如果步骤(2)判断所述汉字是标准汉字,则将所述输入码转换为所述汉字的机内码,并将所述机内码发送给文字处理模块;
(4)如果步骤(2)判断所述汉字是扩展汉字,则将所述输入码转换为相应的扩展字库识别码和所述汉字的机内码,然后向文字处理模块发送对应于所述扩展字库识别码的字体设置命令,并且向文字处理模块发送所述机内码。
根据本发明的装置和方法,能够利用计算机对十万个以上的汉字进入输入、编辑、排版和打印等,从而在需要处理大量汉字的领域中极大地促进计算机的应用。
结合附图,通过以下示例方式对本发明最佳实施方式的描述,本发明的上述和其他目的、特征和优点将会更加明显。
图1是本发明的超大型汉字信息处理方法的总流程图;
图2是造字系统的流程图;
图3是图1中的Microsoft Word 95/97接口管理模块的流程图;
图4是图1中的输入法管理模块的流程图;
图5示出了本发明的汉字信息处理装置的示意结构;以及
图6示出本发明的汉字信息处理方法的流程图。
为解决10万汉字能够在计算机上进行汉字输入、编辑、排版、打印输出或发排印前胶片,就必须有10万汉字库,这是汉字显示、打印的基础。此外,还须有能够输入10万汉字的输入方法,编辑、排版支持系统。
因此,必须解决三个关键技术。第一是先进的曲线描述汉字字模的计算机制作系统,即造字系统;第二是能够输入10万汉字的输入方法;第三是能够对10万汉字进行处理的汉字编辑软件。
造字系统
开发造字系统时,难点在于国外资料仅仅公开了用三次曲线描述英文字母的理论算法,但是没有公开英文造字系统的设计技术。申请人自行设计了曲线汉字算法,完成了计算机造字系统的设计开发,并在使用中不断升级改进。
通过该造字系统制作的曲线汉字符合国际通用的TrueType二次曲线的描述格式。每个汉字的轮廓是由若干条Bezier二次曲线和直线组成的,Bezier二次曲线实际上是由起始点、结束点、中间控制点三个点来描述曲线的形状。在这里,将这三个点称为控制点。直线是由起始点、结束点两个控制点描述。造字系统由以下几部分组成:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中易郑码新技术有限责任公司,未经北京中易郑码新技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/00135547.3/2.html,转载请声明来源钻瓜专利网。