[发明专利]模糊汉字变换装置无效

专利信息
申请号: 93105336.6 申请日: 1993-04-30
公开(公告)号: CN1048341C 公开(公告)日: 2000-01-12
发明(设计)人: 林启轩;张家华 申请(专利权)人: 松下电器产业株式会社
主分类号: G06F3/02 分类号: G06F3/02;G06F3/023
代理公司: 上海专利商标事务所 代理人: 颜承根
地址: 日本国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 模糊 汉字 变换 装置
【说明书】:

本发明涉及中文文字处理机,特别涉及处理输入含糊字音的汉字变换装置。

中文原则上一个汉字与一个字音对应。字音由声母、韵母以及声调构成,而韵母细分为介音和主韵母,因而最终是由声母+介音+主韵母+声调的组合构成的。另外对于声母、介音,原先稍大一些的汉和辞典中也记载着中国话的入门书,因而省略这些说明。又,在中文文字处理器中假如输入了表示这些字音的符号,一个汉字的读音就输入完毕了。这里,中文中的汉字(有“峠”等作为日本国字用而在中文不用的汉字,中文中与日文相同也有在文章中用汉字以外的文字和符号的情况,也有单词特别是固有名词的特殊情况、中文固有的简化字、假名汉字等,这里所称的“汉字”,严格来说不仅限于“日语中所称的汉字”。所谓的概念是以中文文章中的汉字为中心的文字、符号或文字序列、单词的,原则上都称为“汉字”。)读音符号由中国台湾所用的注音符号表示,主要如图6中所示,包含声母、介音、主韵母以及声调共计有四十二个。(另外,除此之外现在较常用的汉字读音符号有中国大陆的罗马拼音字母作为第二类注音符号)。本发明涉及一种由该注音符号(所说的“字音符号”的一种)表示全部读音的文字处理机。但中文发音由于国土辽阔、人口众多,而且生活环境和历史渊源大相径庭,因而常常有无法由汉字读音符号表达或不统一的情况。其原因在于不仅仅是单独使用的汉字种类多,说起来中国话本身也可大致分作北京话、广东话五种之多,还有这种原因,即不用说日本人就是马拉尔语族、阿尔泰语族人也难以听清L与R的音,或是日本语中有方言而且意义及其发音有较大差异。因而,例如卷舌声母“图7中所示的{外1}(由于电子信息处理系统,文字处理机输入都有限制,因而下面本说明书中所用的中文固有的外字、发音符号如“图7{外1}”、“图7{外2}”所记载的那样集中在图7中图示)由于发音类似,容易与不卷舌声母“图7{外2}”混淆,主韵母“图7{外3}”同样容易与“图7{外4}”混淆。因此必须进行模糊处理。以往汉字变换装置的模糊处理有台湾专利75105839中所记载的汉字变换装置。图5(a)是该装置的框图。图5(a)中,10是有指定表音文字以及辞书检索方式的辞书检索方式键的输入部,11是将可由输入部送来的表音文字序列变换为音节符号的音节符号变换部,12是将可由音节符号变换部11送来的音节符号按各变换单位适至下面说明的辞书检索部13,并由使用者选择由辞书检索部13送来的候补单词,而将判断为最终对应的候补单词送至输出部15的汉字变换部,13是根据可由输入部送来的辞书检索方式的指定而从下面说明的辞书14取出候补单词的辞书检索部,14是存储有各组用音节符号表示的中文单词读音和与该单词对应的汉字代码的辞书。

以下对上述构成的汉字变换装置内部处理中所用的音节符号加以说明。图5(b)中示出分别分配给各个声母、介音、主韵母、声调的位组合。这些位组合由2字节定义。

第1、第2字节其最初的位(bit0)都是0,结合韵母的位组合则由介音与主韵母的位组合的组合来表示。例如“图7{外5}”、“图7{外6}”、“图7{外7}”、“图7{外8}”等类似的同音韵成份的位组合间距离为1。即,忽略第1字节的bit5、bit7、等2字节的bit7就可将分别类似的声母、介音、主韵母视为相同。图5(a)中所示的是该以往例中的同音韵成份的位组合相距为1,并且容易混淆的24组音韵成份。输入者设定模糊变换的时候,在借助于检索方式键检索辞书时,忽略辞书中登记的单词读音各音节的第1字节的bit5、bit7、第2字节的bit7,检出相关模糊汉字系或相类模糊单词系。(但在程序编制上则不是忽略而是注意这些位)。例如,使用者想要输入“图7{外9}”时,若按下为忽略介音以及声调而设置的键时,就检出“图7{外10}”、“图7{外11}”等。

然而,上述已有技术的装置有以下问题。不过在冒然以中文为例具体说明该问题之前,先以容易理解的日文为例作概括的说明。日文中表示为“こぅ”假名的汉字有“考”、“公”、“皇”、“光”之多,表示为“こぅぁん”假名的单词也有“考案”、“公案”、“公安”等几个。还有称为“田”的汉字,是根据前后文字或汉字而有多种读音方式,例如“美田”发音为“てん”、“田”发音为“だ”、或是“田烟”发音为“た”等。还有相反情况,虽然种类少且使用频度也不太高,但如“ぢ”与“じ”那样,对于相同发音也有多个假名。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/93105336.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top