[发明专利]用于将输入文本从第一字符集音译到第二字符集的技术有效
申请号: | 201280072741.X | 申请日: | 2012-02-28 |
公开(公告)号: | CN104272223B | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 杨帆;基里尔·布里亚克;袁锋;廖宝华 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F17/30 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 输入 文本 第一 字符集 音译 第二 技术 | ||
技术领域
本公开涉及用户设备,尤其涉及用于进行按第一字符集输入的文本到第二字符集的音译的技术,第二字符集对应于目标语言。
背景技术
此处提供的背景技术描述是出于总体呈现本公开的背景的目的。当前署名的发明人的达到其在该背景技术部分中被描述的程度的工作以及说明书的并不以其它方式表明其在提交时作为现有技术的各个方面既不明示也不暗示被承认为针对本公开的现有技术。
用户可以经由诸如键盘的输入设备将例如文本的信息输入到用户设备。然而,许多键盘限于单个字符集,例如基于拉丁语的字符集。然而,由于尺寸限制,许多用户设备(例如移动用户设备)可以包括限于单个字符集的部分基于QWERTY(标准打字机键盘)的物理键盘。附加地或可替代地,用户设备可以包括向用户显示信息并从用户接收输入的触摸显示器,例如电容感测显示器。例如,这些用户设备可以类似于部分基于QWERTY的键盘向用户显示字符布局。在许多实例中,输入设备(例如诸如键盘和显示的键盘)可能仅支持基于拉丁语的字符。
当用户设备在全世界范围由说不同语言的用户使用时,用户可能不能够以对应于其各自语言的字符集来将文本输入到用户设备。作为响应,用户开发了不同的技术用于将其各自语言的词音译为基于拉丁语的字符。也就是说,用户可以以基于拉丁语的字符来输入文本,以表示与用户的语言对应的字符,例如将第一字符集中的字符映射到第二集中的字符。随着时间推移,这些映射被采纳为不同的映射标准。然而,应当理解:将第一字符集中的字符映射到第二字符集中的字符的不同映射标准可以具有变化和不一致的情况。
发明内容
通过下文提供的详细描述本公开适用的其它领域将变得明显。应当理解,详细描述和具体示例仅出于说明的目的而并非意在限制本公开的范围。
根据本公开的一些方面,公开了用于进行输入文本的音译的技术。该技术可以包括在具有一个或更多处理器的计算设备处接收第一字符集的输入文本,以及在计算设备处基于多个映射标准确定所述输入文本的可能音译的集合。可能音译的集合中的每个可能音译对应于输入文本到与目标语言对应的第二字符集的音译。多个映射标准中的每个映射标准限定第一字符集中的字符到第二字符集中的字符的映射。每个映射标准具有关联的音译概率,每个音译概率指示该音译概率对应的映射标准适于将输入文本音译到第二字符集的似然度。该技术还包括基于音译概率来确定可能音译中的每个可能音译的音译得分,音译得分指示该音译得分对应的可能音译是输入文本的准确音译的似然度。该技术也包括在计算设备处基于可能音译的集合和目标语言的文本语料库确定目标语言的候选词的集合。候选词的集合包括文本语料库中的与可能音译的集合中的一个可能音译匹配的词、与可能音译的集合中的一个可能音译相似的词以及发音与可能音译的集合中的一个可能音译相似的词。该技术还包括在计算设备处基于目标语言的语言模型和所接收的一个或更多先前词确定候选词的集合中的每一个候选词的似然得分,每个似然得分指示相应的候选词对应于输入文本的概率。该技术也包括基于似然得分从计算设备提供候选词的集合中的一个或更多候选词,以及接收指示候选词之一的用户选择。该技术也包括在计算设备处确定多个映射标准中所选择的候选词所基于的特定映射标准,以及在计算设备处基于对特定映射标准的确定来调整音译概率。
在本公开的另一方面中,公开了用于进行输入文本的音译的技术。该技术包括在具有一个或更多处理器的计算设备处接收第一字符集的输入文本,以及在计算设备处基于多个映射标准确定输入文本的可能音译的集合,可能音译的集合中的每个可能音译对应于输入文本到与目标语言对应的第二字符集的音译。多个映射标准中的每个映射标准限定第一字符集中的字符到第二字符集中的字符的映射。该技术还包括在计算设备处基于可能音译的集合和目标语言的文本语料库确定目标语言的候选词的集合,文本语料库对应于目标语言的已知词的集合。该技术还包括在计算设备处基于目标语言的语言模型和所接收的一个或更多先前词确定候选词的集合中的每一个候选词的似然得分,每个似然得分指示相应的候选词对应于输入文本的概率。该技术也包括基于似然得分从计算设备向用户设备提供候选词的集合中的一个或更多候选词,以及在计算设备处接收指示候选词之一的用户选择。
在上述技术的一些实施例中,每个映射标准具有关联的音译概率,每个音译概率指示该音译概率对应的映射标准适于将输入文本音译到第二字符集的似然度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280072741.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:成像装置、成像方法、电子设备和程序
- 下一篇:用于涡轮增压器的轴密封系统