[发明专利]用于将输入文本从第一字符集音译到第二字符集的技术有效
申请号: | 201280072741.X | 申请日: | 2012-02-28 |
公开(公告)号: | CN104272223B | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 杨帆;基里尔·布里亚克;袁锋;廖宝华 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F17/30 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 公开了用于进行第一字符集的输入文本到第二字符集的音译的计算机实现的技术。该技术包括接收输入文本,以及基于多个映射标准来确定输入文本的可能音译的集合。每个映射标准限定第一字符集的字符到第二字符集的字符的映射。该技术还包括基于可能音译和文本语料库来确定目标语言的候选词的集合。该技术还包括基于目标语言的语言模型和先前所接收的词来确定候选词中的每一个候选词的似然得分。该技术还包括基于似然得分来提供一个或更多候选词,以及接收指示候选词之一的用户选择。 | ||
搜索关键词: | 用于 输入 文本 第一 字符集 音译 第二 技术 | ||
【主权项】:
一种计算机实现的方法,包括:在具有一个或更多处理器的计算设备处接收第一字符集的输入文本;在所述计算设备处基于多个映射标准确定所述输入文本的可能音译的集合,所述可能音译的集合中的每个可能音译对应于所述输入文本到与目标语言对应的第二字符集的音译,所述多个映射标准中的每个映射标准限定所述第二字符集的每一个字符到所述第一字符集的一个或多个字符的映射,并且每个映射标准具有关联的音译概率,每个音译概率指示所述音译概率对应的映射标准适于将所述输入文本音译到所述第二字符集的似然度;基于所述音译概率来确定所述可能音译中的每个可能音译的音译得分,所述音译得分指示所述音译得分对应的可能音译是所述输入文本的准确音译的似然度;在所述计算设备处基于所述可能音译的集合和所述目标语言的文本语料库确定所述目标语言的候选词的集合,其中,所述候选词的集合包括所述文本语料库中的与所述可能音译的集合中的一个可能音译匹配的词、与所述可能音译的集合中的一个可能音译相似的词以及发音与所述可能音译的集合中的一个可能音译相似的词;在所述计算设备处基于所述目标语言的语言模型和所接收的一个或更多先前词确定所述候选词的集合中的每一个候选词的似然得分,每个似然得分指示相应的候选词对应于所述输入文本的概率;基于所述似然得分从所述计算设备提供所述候选词的集合中的一个或更多候选词;接收指示所述候选词之一的用户选择;在所述计算设备处确定所述多个映射标准中所选择的候选词所基于的特定映射标准;以及在所述计算设备处基于对所述特定映射标准的所述确定来调整所述音译概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201280072741.X/,转载请声明来源钻瓜专利网。
- 上一篇:成像装置、成像方法、电子设备和程序
- 下一篇:用于涡轮增压器的轴密封系统