[发明专利]集成的本地和基于云的语音识别有效
申请号: | 201210320230.7 | 申请日: | 2012-08-31 |
公开(公告)号: | CN102903362A | 公开(公告)日: | 2013-01-30 |
发明(设计)人: | T·M·苏摩;L·宋;M·H·金;C·R·海涅曼;D·H·霍金斯 | 申请(专利权)人: | 微软公司 |
主分类号: | G10L15/34 | 分类号: | G10L15/34;H04L29/08 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 顾嘉运 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集成 本地 基于 语音 识别 | ||
技术领域
本发明涉及语音识别,尤其涉及本地和基于云的语音识别的集成。
背景技术
语音识别技术可用于将说出的单词或词组转换成文本。基于统计数据的语音识别技术通常利用声学建模和/或语言建模。声学模型可通过以下操作来创建:取得各种语言音频记录(例如,各种单词或词组),将各种音频记录与文本转录相关联,然后创建构成各种单词或词组中的每一个的声音的统计表示。语言模型尝试捕捉特定语言的特性并预测语音序列中的下一个单词或词组。语音模型可包括特定语言中的单词频率和/或单词序列的概率。
发明内容
描述了用于将本地语音识别与基于云的语音识别集成以提供高效的自然用户界面的技术。在一些实施例中,计算设备确定与环境中的特定人相关联的方向并生成与该方向相关联的音频记录,其中源自该方向的声音被放大,而源自其他方向的声音被抑制。该计算设备然后对该音频记录执行本地语音识别以检测该特定人说出的第一话语并检测该第一话语中的一个或多个关键字。该第一话语可通过对音频记录应用话音活动检测技术来检测。该第一话语以及一个或多个关键字随后被传送至服务器,该服务器可标识第一话语中与该一个或多个关键字相关联的语音,并基于所标识的语音来使一种或多种语音识别技术进行适应。
一个实施例包括从与第一环境相关联的多个话筒获取一个或多个声音,确定该第一环境中与一个或多个人相关联的一个或多个方向,以及基于该一个或多个声音来生成一个或多个音频记录,其中该一个或多个音频记录中的每一个都与该一个或多个方向中的不同方向相关联。该方法还包括对该一个或多个音频记录中的每一个执行本地语音识别,包括检测第一话语和检测该第一话语中的一个或多个关键字。该方法还包括将该第一话语以及该一个或多个关键字传送到第二计算设备以及从该第二计算设备接收基于该第一话语的第一响应。
一个实施例包括捕捉设备以及一个或多个处理器。该捕捉设备包括多个话筒。该捕捉设备从与第一环境相关联的多个话筒获取一个或多个声音。该一个或多个处理器确定该第一环境中与一个或多个人相关联的一个或多个方向。该一个或多个处理器基于该一个或多个声音来生成一个或多个音频记录,其中该一个或多个音频记录中的每一个都与该一个或多个方向中的不同方向相关联。该一个或多个处理器检测该一个或多个音频记录中的第一音频记录中的第一话语,并检测该第一话语中的一个或多个关键字。该一个或多个处理器将该第一话语以及该一个或多个关键字传送到第二计算设备,该第二计算设备基于该一个或多个关键字来检测该第一话语中的一个或多个单词。该一个或多个处理器从该第二计算设备接收基于该第一话语的第一响应。
提供本发明内容以便以简化形式介绍将在以下具体实施例中进一步描述的一些概念。本发明内容并非旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
附图简述
图1是可在其中实现所公开的技术的联网计算环境的一个实施例的框图。
图2描绘了目标检测和跟踪系统的一个实施例,用户正在玩拳击游戏。
图3描绘了目标检测和跟踪系统以及与该目标检测和跟踪系统相关联的捕捉设备的视野内的环境的一个实施例。
图4示出了包括捕捉设备和计算环境的计算系统的一个实施例。
图5A是描述集成本地和基于云的语音识别的过程的一个实施例的流程图。
图5B是描述获取一个或多个音频记录的过程的一个实施例的流程图。
图5C是描述获取一个或多个音频记录的过程的一个实施例的流程图。
图5D是描述获取一个或多个音频记录的过程的一个实施例的流程图。
图5E是描述生成一个或多个音频记录的过程的一个实施例的流程图。
图6是描述执行基于云的语音识别的过程的一个实施例的流程图。
图7是描述执行本地语音识别的过程的一个实施例的流程图。
图8是游戏和媒体系统的实施例的框图。
图9是计算系统环境的实施例的框图。
具体实施例
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210320230.7/2.html,转载请声明来源钻瓜专利网。