[发明专利]一种汉字拆分处理方法无效

专利信息
申请号: 95105981.5 申请日: 1995-06-07
公开(公告)号: CN1152143A 公开(公告)日: 1997-06-18
发明(设计)人: 林兵 申请(专利权)人: 林兵
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 暂无信息 代理人: 暂无信息
地址: 100044 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 汉字 拆分 处理 方法
【说明书】:

发明属于计算机中文信息处理领域。

计算机在中国的普及和应用有赖于计算机对中文的处理能力,其中汉字的计算机输入问题是一个比较难于实现的问题。汉字的数量庞大,字形复杂,属性众多,难于使用西文标准键盘输入。

目前已有的汉字输入方案很多,大致分为音码、形码、音形码等几类。

除了最简单的拼音输入方法,其它各种以字形为基础的编码方案都需要对汉字进行拆分。这是必要的,也是可能的。因为通过分析汉字的字形,可以发现汉字有一定的组成规律;汉字的字形可以分为笔画、字根、整字若干层次,笔画的类型和数目最多为数十种,字根的数目最多为数百种,各种字根相互组合形成了数万个汉字。用数十个键位来直接表达数十个笔画、数百个字根,然后把由字根部件组合成的汉字进行拆分,依次对每个字根进行描述,这也就是目前各类编码方案的核心思想。

各类方案的不同点主要表现在对字根部件特征的提取、描述,以及与键位的对应关系上,不同编码各自的规则包括一套字根部件特征描述规则和与之对应的键位安排,以及汉字的拆分规则两大部分。

决定汉字拆分方法的因素是汉字的组成规律和字根部件的选取方法。

汉字拆分中遇到的问题一是拆分结果的表示,二是字根部件的选择。

汉字拆分的结果是把一个整字分割成一个汉字组件的序列,在分割过程中往往产生一些在标准汉字集合(比如GB2312,ISO10646等)中没有收入的字符,比如,“学”字的上部件,“泰”字的上部件和下部件,如何表示这种字符,人们采取了不同的方法,有经济实力的单位一般自己搜集整理出一套字符集合,把它们安排在标准字符集合的未用区域,同时为这些字符制作相应的显示和打印字模;其它一些人则尽量回避这一问题,比如一般的编码说明材料中都不提供完整的汉字拆分表,而是使用手工书写或者造字软件造字的方法列举一些说明性的汉字拆分示例,然后提供用西文字符表示的码表。个别单位、个别人自己搜集整理非标准字符、安排内码、制作显示字模和打印字模,整个过程工作量大,又无标准可循,容易造成人力、物力资源的重复性投入。

汉字拆分时,由于字根部件的选择差异,导致汉字拆分结果的不同,各种方案对汉字的拆分方法各异,比较混乱。这个问题已经引起了有关专家的注意,不少文字专家提出了防止“文字污染”的观点;同时这个问题也使用户感到茫然,无所适从。比如对“束”的拆法就有“一口小”“十口八”“木口”等等几种。诸如此类为了减少重码率,盲目对汉字强行拆分的作法,造成了当前汉字编码中的一些不科学、不规范、不合理现象,直接影响着计算机与汉字的教学和应用。

本发明就是针对汉字拆分处理中存在的这些问题而提出的。目的是解决汉字拆分过程中出现的非标准汉字字根、部件无法统一表示的问题以及汉字拆分过程中的不科学、不规范、不合理现象。

考察汉字拆分过程产生的标准字符集合中未收入的字符,即非标准字根部件,可以看出,它们或者是一个或几个标准汉字的变形,或者是一个或几个标准汉字的部件。比如:“慕”的下部字根是“心”的变体,“泰”的下部字根是“水”的变体;“泰”的上部字根是该字的一部分,也是“春”“奉”“奏”“秦”等字的一部分。非标准字符都是来源于标准字符的,这样就可以使用标准字符加注一个标记的方法来表示非标准字符。

这种特殊标记作为一种转义符号,当一个标准字符和转义符号同时出现时,就说明表示的是非标准字符。

转义符号要选自计算机信息交换字符集中,可以是单字节,也可以是双字节。

为了避免符号使用的冲突,转义符号可以选择在中文文本中比较罕用的西文符号。

转义符号可以使用一个,也可以使用几个。如果使用几个,可以分别赋予它们不同的含义,比如使用几个转义符号分别表示非标准部件在标准部件内的位置,包括上部件、下部件、左部件、右部件等等。这样有助于识别非标准字符和对应的标准字符之间的关系。

在选择标准的对应字符时可以考虑字形相似、同源变体、字形包含、常用、首部件等几个因素,便于联想、识别。

所谓字形相似是指形状相似的变形字,比如:“水”和“泰“字的下部件;所谓同源变体是指来源相同、字体发生变化,比如:“心”和“慕”字的下部件;所谓字形包含是指标准字包含非标准部件,比如:“学”字包含“学”字的上部件;所谓常用是指标准字符比较常用;所谓首部件是指书写时先写的部件,比如:“朝”的左部件就是首部件;图1。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于林兵,未经林兵许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/95105981.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top