[发明专利]使用基于位置的语言建模的自动输入信号识别无效
申请号: | 201380011595.4 | 申请日: | 2013-03-05 |
公开(公告)号: | CN104160440A | 公开(公告)日: | 2014-11-19 |
发明(设计)人: | H·M·陈 | 申请(专利权)人: | 苹果公司 |
主分类号: | G10L15/197 | 分类号: | G10L15/197;G10L15/22 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 李玲 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 基于 位置 语言 建模 自动 输入 信号 识别 | ||
背景技术
1.技术领域
本发明涉及自动输入信号识别,并且更具体地讲,涉及通过使用基于位置的语言建模来改善自动输入信号识别。
2.简介
输入信号识别技术(诸如语音识别)近年来已经获得显著地扩展。其用途已从具有有限词汇的非常具体的使用情况(诸如自动电话应答系统)扩展到说任何话的语音识别。然而,由于可能的输入信号的数量和类型已经拓宽,所以提供准确的结果仍然是一种挑战。这对于依赖用于所有输入信号的全球语言模型的识别系统而言尤其如此。在这种情况下,对于特定地理区域是唯一的输入信号经常不能被正确地识别。
该问题的一种解决方案可以是创建本地语言模型,在本地语言模型中基于输入信号的位置来选择特定语言模型。例如,服务区可被划分成多个地理区域,并且本地语言模块可被构造用于每个区域。然而,这种方法可能导致在相反的方向上偏差的识别结果。即,对于特定区域不是唯一的输入信号可能不能被正确地识别为本地词序列,因为语言模型对本地词序列更重地加权。另外,这种解决方案只考虑一个地理区域,如果位置靠近该地理区域的边界并且输入信号对应于在相邻地理区域中是唯一的词序列,那么其仍可能产生不准确的结果。
发明内容
本公开的附加特征和优点将在随后的描述中进行阐述,并且部分地将从该描述显而易见,或者可以通过实践本文所公开的原理而获知。本公开的特征和优点可借助于所附权利要求中特别指出的器械和组合来实现并获得。本公开的这些和其他特征将通过以下描述和所附权利要求变得更加充分地明显,或者可以通过本文所阐述的原理的实践而获知。
本发明描述了用于自动识别输入信号以产生词序列的系统、方法和非暂态计算机可读介质。方法包括接收输入信号诸(如语音信号),以及相关位置。基于位置来选择第一本地语言模型。在一些配置中,每个本地语言模型均具有相关的预定地理区域。在这种情况下,本地语言模型通过首先辨识非常适合该位置的地理区域来选择。可以选择该地理区域是因为该位置包含在该地理区域内和/或因为该位置在分配给该地理区域的质心的指定阈值距离内。第一本地语言模型然后与全球语言模型合并以生成混合语言模型。基于混合语言模型通过辨识在统计上最可能对应于输入信号的词序列来识别输入信号。
在一些配置中,可基于位置选择一组另外的本地语言模型。然后第一本地语言模型和一组另外的本地语言模型中的每个语言模型可与全球语言模型合并以生成混合语言模型。另外,在一些情况下,在合并之前,可为本地语言模型中的一个或多个分配权重。权重可基于多种因素,诸如用于构建本地语言模型的本地信息的所感知的准确度和/或位置距地理区域的质心的距离。当分配权重时,权重可用于影响合并步骤。
根据一些具体实施,提供了用于输入信号识别的方法,该方法包括接收输入信号和与输入信号相关的位置;基于该位置从多个本地语言模型中选择第一语言模型;通过处理器合并第一本地语言模型与全球语言模型以生成混合语言模型;以及基于混合语言模型通过辨识在统计上最可能对应于输入信号的词序列来识别输入信号。
在一些具体实施中,输入信号为语音信号。在一些具体实施中,第一本地语言模型映射到与位置相关的地理区域,该地理区域包含质心。在一些具体实施中,位置包含在地理区域内。在一些具体实施中,位置在质心的指定阈值距离内。在一些具体实施中,地理区域由所建立的地理位置定义。
在一些具体实施中,该方法包括基于位置从多个本地语言模型中选择第二本地语言模型,并且还包括合并第一本地语言模型、第二本地语言模型和全球语言模型以生成混合语言模型。在一些具体实施中,该方法包括,在合并第一本地语言模型、第二本地语言模型和全球语言模型之前,将第一权重值(和/或缩放系数)分配给第一本地语言模型,并且将第二权重值(和/或缩放系数)分配给第二本地语言模型。在一些具体实施中,第一权重值(和/或缩放系数)和第二权重值(和/或缩放系数)中的至少一者至少部分地基于位置距包含在所选择的地理区域内的质心的距离。在一些具体实施中,第一权重值(和/或缩放系数)和第二权重值(和/或缩放系数)中的至少一者至少部分地基于分配给本地语言模型的准确度水平。在一些具体实施中,当位置在与该位置相关的地理区域之外时,将第一权重值和第二权重值中的至少一者分别施加至第一本地语言模型或第二本地语言模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380011595.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:导电性膜的形成方法
- 下一篇:用于远程控制的烟囱远程监测系统