[发明专利]拼音序列到汉字串(词组)的转换方法无效
申请号: | 89104242.3 | 申请日: | 1989-06-26 |
公开(公告)号: | CN1019055B | 公开(公告)日: | 1992-11-11 |
发明(设计)人: | 李慧勤;陈力为;张普;朱守涛;于耀宗;邱德政;李红;刘国琴;左京强;沈刚;黄建平;向华;张庆;任杰 | 申请(专利权)人: | 能源部电力科学研究院;机械电子工业部计算机与微电子发展研究中心;北京语言学院 |
主分类号: | G06F15/40 | 分类号: | G06F15/40 |
代理公司: | 祥云专利事务所 | 代理人: | 秦月贞 |
地址: | 北京市清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 拼音序列到汉字串(词组)的转换方法,以汉字字音数据库和汉字词语数据库为基础,在其上建立了完成自动分词、同音词辨识的拼音序列到汉字串的转换器,辅以拼法检查、自动记忆、组词造码、多次变换等技术,用户可以选择使用汉字的四声,以进一步提高输入速度。在同音词辨识中考虑了词频、词词搭配、临近环境、前缀和后缀、专有名词(人名、地名)等因素,大幅度降低了同音词的重码率。用户在使用时用标准的汉语拼音连续输入,无需每输入一个字即停下来进行选择。 | ||
搜索关键词: | 拼音 序列 汉字 词组 转换 方法 | ||
【主权项】:
1.拼音序列到汉字串(词组)的转换方法(简称转换方法),其特征在于:A.一个汉字字音数据库,其数据结构为,汉字声母韵母四声使用频度B.一个汉字词语数据库,其数据结构为,词条词音词类语义项使用频度C.建立在上述两个数据库基础上的拼音序列到汉字串的转换器,包括自动分词和同音词识别,其判别规则包括词频、词语搭配、临近环境、前缀和后缀、专有各词,该转换器是根据特征C.所描述的内容由计算机软件实现的一种转换方法,其转换过程是,(1)用户从键盘输入的每个音节串首先经过拼法检查器,与汉字字音库形成的语音链进行实时匹配,将正确的、完整的输入拼音音节送到自动分词进行词语转换,(2)由自动分词技术进行分词,即采用逆向最大匹配的分词算法,从逆向对拼音序列进行划分,并与词语数据库进行匹配,给出可选择的各种结果,(3)在分词匹配的过程中,如遇同音词,就建立同音词表,根据词语数据库的知识进行同音词的辨识,可排除大量的同音词,从而给出正确或可选择的结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于能源部电力科学研究院;机械电子工业部计算机与微电子发展研究中心;北京语言学院,未经能源部电力科学研究院;机械电子工业部计算机与微电子发展研究中心;北京语言学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/89104242.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种矿山通风除尘方法及装置
- 下一篇:热交换装置