[发明专利]中文汉字变换方式无效
申请号: | 89102915.X | 申请日: | 1989-04-26 |
公开(公告)号: | CN1019233B | 公开(公告)日: | 1992-11-25 |
发明(设计)人: | 楠井健 | 申请(专利权)人: | 楠井健 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F15/38 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 马铁良,匡少波 |
地址: | 日本大阪*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 汉字 变换 方式 | ||
本发明是一种可以应用于中文电子计算机或中文文字处理机等方面的中文汉字变换方式,特别是一种能使中文拼音音码输入的音节串自动变换成汉字词串的中文汉字变换方式。
作为中文输入方式,已有一种以省略声调的拼音音码输入音节串的技术。例如,日本电气公司和中国科学院计算技术研究所·中国科学院广州电子技术研究所合作开发的、1988年1月29日通过中国政府国家技术鉴定的“MC式中文输入系统”(见1988年2月1日《人民日报》)便是如此。该中文输入系统采用声母韵母双拼左右交替两打方式,以音节为单位输入中文词音,可以高速度地进行输入。
该中文输入系统采用的是可将输入的音节串自动变换成汉字词的中文汉字变换方式。该中文汉字变换方式包含两个部分,一是以中文词音为索引存储各个词音的汉字词的词典,二是能响应输入从词典存储的汉字词中调出其中之一的处理装置。这里的词音是指中文中各个单词的“读音”。该处理装置使用的是一种和日文文字处理机使用的最长一致法相同的方式。所谓最长一致法就是利用语言学上所讲的日语的“粘着语”的特征对音节串自动进行适当词音分割的方法。因而,在日文文字处理机中,最长一致法做出了很大贡献,它使变换键的使用次数即借助人力对音节串进行分割的次数大为减少。
但是,中文属于语言学上所讲的“孤立语”,采用最长一致法或其他类似方式,就会产生许多音节串词音分割失当的问题。于是,上述中文汉字变换方式中的汉字变换准确度必然不能令人满意。
也许可以在输入作业时频繁使用变换键进行词音分割,从而到提高汉字变换准确度的目的,但是中文是以汉字罗列的形式构成的,词与词之间的分割点很难明确,所以借助人力进行音节串分割尚有困难。
本发明的目的在于要提供一种能以相当高的准确度自动将中文拼音音码形式输入的音节串变换成汉字串的中文汉字变换方式。
本发明的另一个目的是要提供一种经过短时间处理便能自动将中文拼音音码形式输入的音节串变换成汉字串的中文汉字变换方式。
本发明是一种中文汉字变换方式,其中包含两个部分,一是以中文的词音为索引存储各个词音的汉字词的词典,二是能调出该词典存储的汉字词之一的处理装置。
本发明的特征如下:
上述词典含有一个能以汉语词音为索引,根据上述汉字词的词音,存储单音节词音及双音节词音频级的频级存储装置。上述处理装置则包括词音·频级检索装置、词音·频级存储装置、最优词音分割生成装置以及汉字词检索装置。
上述词音·频级检索装置能根据业已输入的音节串中刚刚输入的单音节词音,检索上述词典的频级存储装置并调出该单音节词音的频级;同时还能根据该单音节词音同在它前面输入的单音节词音这两个单音节词音音节构成的双音节词音,检索上述词典并调出该双音节词音的频级。
上述词音·频级存储装置能存储上述两个单音节词音各自的词音和频级,以及上述双音节词音的词音和频级。
当检索不出上述双音节词音时,就将上述刚刚输入的单音节词音的前面视为节点。在上述刚刚输入的单音节词音前面输入的音节串中,该节点同前面已经得到的节点之前便构成一个信息处理句。上述词音·频级调出装置的作用是从上述词音·频级存储装置中调出该信息处理句中的单音节词音和双音节词音的词音和频级。
上述最优词音分割型生成装置能根据上述信息处理句中单音节词音和双音节词音组合而成的各个分割型,求出构成各个分割型的单音节词音和双音节词音的频级总和,并根据该总和生成上述信息处理句的最优词音分割型。
上述汉字词检索装置能根据上述最优词音分割型分割出来的各个词音,检索上述词典,调出以该词音为索引的汉字词之一。
采用本发明可以获得一种能高准确度地、高响应速度地将中文拼音音码形式输入的音节串自动变换成汉字的中文汉字变换方式。
图1为说明本发明原理的时间图。
图2表示例句词音串上的各个词音及其信息量。
图3表示图2中的词音串的网络(1)·(2)和汉字变换结果(3)。
图4表示本发明的中文汉字变换方式的方块图。
图5为图4中的中文汉字变换方式所包含的各个存储装置的存储内容一览表。
图6表示音节输入序号从1到7时可能出现的词音分割型。
图7表示对图2的词音串进行词音分割处理的一个实例说明。
图8表示词音分割型的树形结构。
图9(1)表示对词音串进行词音分割处理的另一实例说明。
图9(2)表示与图9(1)的词音分割处理同步进行的词音汉字变换处理的说明。
图10为词音分割型一览表。
图11(1)·(2)表示对准节点的说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于楠井健,未经楠井健许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/89102915.X/2.html,转载请声明来源钻瓜专利网。