[发明专利]用于使用搜索查询信息的言语识别处理的方法和系统有效
申请号: | 201380064902.5 | 申请日: | 2013-10-14 |
公开(公告)号: | CN104854654A | 公开(公告)日: | 2015-08-19 |
发明(设计)人: | 佩德罗·J·莫雷诺·门吉巴尔;杰弗瑞·斯科特·索伦森;尤金·魏因施泰因 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G10L15/197 | 分类号: | G10L15/197;G06F17/21;G06F17/30 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 使用 搜索 查询 信息 言语 识别 处理 方法 系统 | ||
相关申请的交叉引用
本申请要求2013年3月15日提交的并且题为“Methods And Systems For Speech Recognition Processing Using Search Query Information”的美国专利申请序列号13/832,136的优先权,它是2012年10月18日提交的并且题为“Methods and Systems for Speech Recognition Processing Using Search Query Information”的美国专利申请序列号61/715,365的非临时申请,所有这些专利申请在此通过引用并入本文,如同在本说明书中充分阐述一样。
背景技术
自动言语识别(ASR)技术可用于将音频话语映射至那些话语的文本表示。一些ASR系统使用“训练”,其中个体说话人将文本段读入到言语识别系统中。这些系统分析人的特定语音并且使用该语音来精细调节对该人的言语的识别,从而得到更准确的转录。不使用训练的系统可被称作“说话人无关”的系统。使用训练的系统可被称作“说话人有关”的系统。
发明内容
本申请公开了用于言语识别处理的系统和方法。在一个方面,描述了一种方法。该方法可包括在计算装置处接收指示搜索查询向搜索引擎的提交频率的信息。所述搜索查询可包括词序列。所述方法还可包括基于所述搜索查询的提交频率超过阈值,针对所述搜索查询的所述词序列基于所述搜索查询的一个或多个词出现于所述搜索查询的所述词序列中的顺序来确定所述一个或多个词的分组。所述方法还可包括将指示所述分组的信息提供给言语识别系统以更新给定词序列的语料库。所述言语识别系统可被配置为基于给定词序列的语料库将给定说出话语转换为给定词序列。
在另一方面,描述了一种其上存储有指令的计算机可读介质,所述指令在由计算装置执行时使得所述计算装置执行功能。所述功能可包括接收指示搜索查询向搜索引擎的提交频率的信息。所述搜索查询可包括词序列。所述功能还可包括基于所述搜索查询的提交频率超过阈值,针对所述搜索查询的所述词序列,基于所述搜索查询的一个或多个词出现于所述搜索查询的所述词序列中的顺序来确定所述一个或多个词的分组。所述功能还可包括将指示所述分组的信息提供给言语识别系统以更新给定词序列的语料库。所述言语识别系统可被配置为基于给定词序列的语料库将给定说出话语转换为给定词序列。
在另一方面,描述了一种装置。所述装置可包括至少一个处理器。所述装置还可包括数据存储装置以及该数据存储装置中的程序指令,所述程序指令在由所述至少一个处理器执行时使得所述装置接收指示搜索查询向搜索引擎的提交频率的信息。所述搜索查询可包括词序列。所述数据存储装置中的程序指令在由所述至少一个处理器执行时还使得所述装置基于所述搜索查询的提交频率超过阈值,针对所述搜索查询的所述词序列基于所述搜索查询的一个或多个词出现于所述搜索查询的所述词序列中的顺序来确定所述一个或多个词的分组。所述数据存储装置中的程序指令在由所述至少一个处理器执行时还使得所述装置将指示所述分组的信息提供给言语识别系统以更新给定词序列的语料库。所述言语识别系统可被配置为基于给定词序列的语料库将给定说出话语转换为给定词序列。所述言语识别系统还可包括所述语料库的给定词序列的出现概率。
以上发明内容仅是例示性的,而非意在以任何方式限制。除了例示方面以外,上述实施例和特征,另外的方面、实施例和特征将通过参照附图以及以下具体实施方式而变得显而易见。
附图说明
图1图示出依据示例实施例的示例自动言语识别(ASR)系统。
图2图示出依据实施例的示例声学模型的各方面。
图3图示出依据实施例的ASR系统的示例搜索图。
图4是依据实施例的用于言语识别处理的示例方法的流程图。
图5A图示出依据实施例的示例搜索查询的示例自动机表示。
图5B图示出依据实施例的示例搜索查询的示例bi-gram语言模型。
图5C图示出依据实施例的示例搜索查询的示例因子图。
图6图示出依据示例实施的示例分布式计算架构。
图7A是依据示例实施例图示的示例计算装置的框图。
图7B示出依据示例实施例的基于云的服务器系统。
图8是图示出根据本文所呈现的至少一些实施例布置的示例计算机程序产品的局部概念图的示意图,该计算机程序产品包括用于在计算装置上执行计算机处理的计算机程序。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380064902.5/2.html,转载请声明来源钻瓜专利网。