[发明专利]集成的本地和基于云的语音识别有效
申请号: | 201210320230.7 | 申请日: | 2012-08-31 |
公开(公告)号: | CN102903362A | 公开(公告)日: | 2013-01-30 |
发明(设计)人: | T·M·苏摩;L·宋;M·H·金;C·R·海涅曼;D·H·霍金斯 | 申请(专利权)人: | 微软公司 |
主分类号: | G10L15/34 | 分类号: | G10L15/34;H04L29/08 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 顾嘉运 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明描述了集成的本地和基于云的语音识别。描述了一种用于将本地语音识别与基于云的语音识别集成以提供高效的自然用户界面的系统。在一些实施例中,计算设备确定与环境中的特定人相关联的方向,并生成与该方向相关联的音频记录。该计算设备然后对该音频记录执行本地语音识别以检测该特定人说出的第一话语并检测该第一话语中的一个或多个关键字。该第一话语可通过对音频记录应用话音活动检测技术来检测。该第一话语以及一个或多个关键字随后被传送至服务器,该服务器可标识第一话语中与该一个或多个关键字相关联的语音,并基于所标识的语音来使一种或多种语音识别技术进行适应。 | ||
搜索关键词: | 集成 本地 基于 语音 识别 | ||
【主权项】:
一种用于执行语音识别的方法,包括:从多个话筒获取(502)多个音频信号,所述多个音频信号中的每一个都与所述多个话筒中的不同话筒相关联,所述多个音频信号与第一环境相关联;确定(507)所述第一环境中的一个或多个方向,所述第一环境包括一个或多个人,所述一个或多个方向中的每一个都与所述一个或多个人中的不同人相关联;基于所述多个音频信号来生成(508)一个或多个音频记录,所述一个或多个音频记录中的第一音频记录通过以下操作生成:对所述多个音频信号应用音频信号处理技术以使得源自所述一个或多个方向中的第一方向的声音被放大,同时源自一个或多个其他方向的其他声音被削弱;对所述多个音频记录中的每一个执行(512)本地语音识别,所述执行本地语音识别包括检测第一话语以及检测所述第一话语中的一个或多个关键字,所述第一话语通过对所述一个或多个音频记录中的第一音频记录应用一种或多种语音检测技术来检测;将所述第一话语以及所述一个或多个关键字传送(516)到第二计算设备,所述第二计算设备对所述第一话语执行语音识别技术,所述语音识别技术检测所述第一话语中的一个或多个单词;以及从所述第二计算设备接收(518)基于所述第一话语的第一响应。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210320230.7/,转载请声明来源钻瓜专利网。