[发明专利]一种形式化拼音和汉字对应识别的方法有效

专利信息
申请号: 201510521938.2 申请日: 2015-08-25
公开(公告)号: CN105045410B 公开(公告)日: 2019-02-12
发明(设计)人: 任仰福 申请(专利权)人: 任仰福
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 暂无信息 代理人: 暂无信息
地址: 065400 河北省廊坊市*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 形式化 拼音 汉字 对应 识别 方法
【说明书】:

本发明针对汉语信息处理的需要,在对现行拼音方案改进的基础上,利用一至三个字母定音定调的音节或音节后附加义标字母组成的形式化拼音编码和一万多个汉字对应识别的方法,也就是和包括国标GB2312‑80字符集中的全部简化汉字、繁体字、多音字在内的所有汉字一一对应无重码。使得汉字与国际公认的ASCII字符接轨,将汉字本身拆分为可独立计算的子单元,使汉字信息的数字解析、判断推理等计算机运算成为可能。同时,这也是一种直接输入汉语汉字的方法(准确表音,可直读。不用选字输入,一个汉字最多四码,每个词平均不足五码),按照拼音和编码规则或输入拼音后看提示栏就能直接输入要打的字。

技术领域:

本发明涉及一种用形式化的拼音直接输入汉语的方法,尤其涉及用形式化的拼音直接输汉字的方法。形式化的拼音是和汉字一一对应、可以准确表示普通话语音并且可以代表汉字以单字节的形式进行存储和计算、符合国际标准的数字化文字形式。

背景技术:

目前我们使用的各种汉字输入法都是编码输入(语音输入除外),但是,所有编码输入汉字的方法都不能消除重码,特别是不能表示字音(或不能准确表示字音),实际上就是:所有编码都不能直接、准确地输入语言和文字、不能自动转换为符合国际标准的、唯一准确的数字化形式在电脑上进行存储和运算。在汉字能够输入电脑之后,我国许多研究机构就先后开始了大规模的汉字信息处理的研究,(包括语音识别研究的首要目标也是如何将语音流准确识别为汉字的形式),国家有关部门也先后制定出了和汉字一一对应的国家标准字符集的双字节机内码和扩展字符集的四字节机内码,希望将输入的汉字由计算机自动转换成双字节或四字节二进制码之后就可以象拼音文字一样进行语言信息处理了。但是,多年来大规模研究的实践经验告诉我们,中文的信息、处理远比拼音文字的信息处理要困难得多。这是因为在现代汉语中双音词占绝对优势,还有数量可观的多音词(包括使用频率很高的成语在内),单音词数量有限。因为“词义不是别的,它就是语音物化的思想,是语言的一个最小单位的实际内容。这个内容是被一定的语音物质形式固定下来的。没有词的形式也就没有词的意义。词义是在历史上形成并在集体中承受下来,用音组固定下来的关于对象的概括。换言之,词用它的物质-音组-概括着整个一类对象的最一般的和特殊的足以确定适合于该词的概念的外延的特征。”见著名语言学家孙常叙著《汉语词汇》第43页。所以说,只有词才是语言信息处理的最小单位,汉字文章信息处理的首要任务是分词。因此,近几年来,国内许多研究机构、大专院校都进行了汉语自动分词的深入研究。但是由于汉字的多音多义性和相互组合成词的灵活性,书面上汉字无间隔的等距离排列等因素都是造成分词不可避免的出现失误的原因。前国家语委主任许嘉璐在谈到目前我国中文信息处理的现状时说:“虽然经过几十年的努力,目前中文信息处理还停留在字处理的阶段,”更为重要的是:“一个汉字在计算机中需要至少两个字节表示,尤其需要强调的是在计算机中表示汉字的两个字节、四个字节是必须捆绑在一起使用的二进制无序码,因此它只能作为这个汉字的标识码而没有任何运算价值”见《可计算中文映射字典》前言。国际标准ASCII码是单字节编码系统,并且每个字符的数字化编码都只占用了一个字节的后7位,同时字节的最高位置“0”可用做数据传输中的效验码来确保传输的正确性。为了解决汉字编码和国际标准码不兼容的问题,非ASCII码(两字节以上)字节全部高位置“1”以示区别。但是,因为汉字两字节及四字节的编码不可拆分、不可错位,这就同时还需要各种标识表示置“1”码的特征,其繁琐程度和安全隐患可想而知。因为数据传输中信号的衰减是随机的,也是不可避免的。并且,代表汉字的双字节还可能和扩充了的ASCII代码发生混淆,这些都会造成中文乱码,甚至导致系统锁死或系统崩溃的严重后果。

2012年9月,史颖先生根据他的发明专利(ZL2007 1 0000310.3)编写出版了《汉语拼字方案》,又名《可计算中文映射字典》,其编码规则为:

行、列、纵、序四个西文大写字母表示每个汉字:其中行为声母,使用23个西文大写字母表示,无声母将第一字符作为行来表示,字母IVU作为特殊用途。对应关系如下:

A:a B:b C:c,c h D:d E:e F:f G:g H:h J:j K:k L:l M:m N:n O:o

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于任仰福,未经任仰福许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510521938.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top