[发明专利]用于将输入文本从第一字符集音译到第二字符集的技术有效
申请号: | 201280072741.X | 申请日: | 2012-02-28 |
公开(公告)号: | CN104272223B | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 杨帆;基里尔·布里亚克;袁锋;廖宝华 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F17/30 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 输入 文本 第一 字符集 音译 第二 技术 | ||
1.一种计算机实现的方法,包括:
在具有一个或更多处理器的计算设备处接收第一字符集的输入文本;
在所述计算设备处基于多个映射标准确定所述输入文本的可能音译的集合,所述可能音译的集合中的每个可能音译对应于所述输入文本到与目标语言对应的第二字符集的音译,所述多个映射标准中的每个映射标准限定所述第二字符集的每一个字符到所述第一字符集的一个或多个字符的映射,并且每个映射标准具有关联的音译概率,每个音译概率指示所述音译概率对应的映射标准适于将所述输入文本音译到所述第二字符集的似然度;
基于所述音译概率来确定所述可能音译中的每个可能音译的音译得分,所述音译得分指示所述音译得分对应的可能音译是所述输入文本的准确音译的似然度;
在所述计算设备处基于所述可能音译的集合和所述目标语言的文本语料库确定所述目标语言的候选词的集合,其中,所述候选词的集合包括所述文本语料库中的与所述可能音译的集合中的一个可能音译匹配的词、与所述可能音译的集合中的一个可能音译相似的词以及发音与所述可能音译的集合中的一个可能音译相似的词;
在所述计算设备处基于所述目标语言的语言模型和所接收的一个或更多先前词确定所述候选词的集合中的每一个候选词的似然得分,每个似然得分指示相应的候选词对应于所述输入文本的概率;
基于所述似然得分从所述计算设备提供所述候选词的集合中的一个或更多候选词;
接收指示所述候选词之一的用户选择;
在所述计算设备处确定所述多个映射标准中所选择的候选词所基于的特定映射标准;以及
在所述计算设备处基于对所述特定映射标准的所述确定来调整所述音译概率。
2.一种计算机实现的方法,包括:
在具有一个或更多处理器的计算设备处接收第一字符集的输入文本;
在所述计算设备处基于多个映射标准确定所述输入文本的可能音译的集合,所述可能音译的集合中的每个可能音译对应于所述输入文本到与目标语言对应的第二字符集的音译,所述多个映射标准中的每个映射标准限定所述第二字符集的每一个字符到所述第一字符集的一个或多个字符的映射,并且每个映射标准具有关联的音译概率,每个音译概率指示所述音译概率对应的映射标准适于将所述输入文本音译到所述第二字符集的似然度;
在所述计算设备处基于所述音译概率确定所述可能音译中的每个可能音译的音译得分,所述音译得分指示所述音译得分对应的可能音译是所述输入文本的准确音译的似然度;
在所述计算设备处基于所述可能音译的集合和所述目标语言的文本语料库确定所述目标语言的候选词的集合,所述文本语料库对应于所述目标语言的已知词的集合;
在所述计算设备处基于所述目标语言的语言模型和所接收的一个或更多先前词确定所述候选词的集合中的每一个候选词的似然得分,每个似然得分指示相应的候选词对应于所述输入文本的概率;
基于所述似然得分从所述计算设备向用户设备提供所述候选词的集合中的一个或更多候选词;
在所述计算设备处接收指示所述候选词之一的用户选择;
在所述计算设备处确定所述多个映射标准中所选择的候选词所基于的特定映射标准;以及
在所述计算设备处基于对所述特定映射标准的所述确定来调整所述音译概率。
3.根据权利要求2所述的计算机实现的方法,其中,所述文本语料库包括列出所述目标语言的多个词的至少一个词典。
4.根据权利要求3所述的计算机实现的方法,还包括:确定所述可能音译中的一个可能音译与所述文本语料库中的所述多个词中的一个词之间的相似度,以及基于所述相似度将所述一个词选择性地包括在所述候选词的集合中。
5.根据权利要求2所述的计算机实现的方法,其中,确定所述候选词的集合还包括:将所述文本语料库中发音与所述可能音译中的一个或更多可能音译相似的词包括在所述候选词的集合中。
6.根据权利要求5所述的计算机实现的方法,其中,利用Soundex算法来确定发音与一个或更多可能音译相似的所述词。
7.根据权利要求2所述的计算机实现的方法,其中,所述语言模型是隐马尔可夫模型。
8.根据权利要求2所述的计算机实现的方法,其中,所述用户设备是所述计算设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280072741.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:成像装置、成像方法、电子设备和程序
- 下一篇:用于涡轮增压器的轴密封系统