[发明专利]混合模型语音识别有效
申请号: | 201810238968.6 | 申请日: | 2013-06-26 |
公开(公告)号: | CN108648750B | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | A·H·格伦斯坦;P·阿列克西克 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/14;G10L15/19;G10L15/26;G10L15/32;G10L15/30 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李佳;穆德骏 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混合 模型 语音 识别 | ||
1.一种计算机实现的方法,包括:
通过移动计算设备或数字助理设备接收与用户的话语相对应的音频数据;
通过在所述移动计算设备或所述数字助理设备上实现的自动语音识别器,生成与所述移动计算设备或所述数字助理设备能够执行的话音动作相关联的个性化转录,所述自动语音识别器具有词汇,所述词汇包括未被包含在基于云的自动语音识别器的词汇中的一个或多个术语,所述个性化转录包括未被包含在所述基于云的自动语音识别器的所述词汇中的所述一个或多个术语中的一个或多个;
通过所述移动计算设备或所述数字助理设备将所述音频数据传输到所述基于云的自动语音识别器,所述基于云的自动语音识别器被配置来:
生成所述话语的错误转录;以及
将所述话语的所述错误转录传输到所述移动计算设备或所述数字助理设备;
通过所述移动计算设备或所述数字助理设备确定由所述基于云的自动语音识别器生成的所述话语的所述错误转录是否包括与所述移动计算设备或所述数字助理设备能够执行的所述话音动作相关联的术语;以及
当由所述基于云的自动语音识别器生成的所述话语的所述错误转录包括与所述移动计算设备或所述数字助理设备能够执行的所述话音动作相关联的术语时,提供搜索结果页面以用于由所述移动计算设备或所述数字助理设备输出,所述搜索结果页面包括(i)用于发起与所述个性化转录相关联的所述话音动作的控件,以及(ii)一个或多个搜索结果,所述一个或多个搜索结果是基于由所述基于云的自动语音识别器生成的所述话语的所述错误转录而生成的。
2.根据权利要求1所述的方法,其中,未被包含在所述基于云的自动语音识别器的所述词汇中的所述一个或多个术语包括未同步到云的联系人姓名。
3.根据权利要求1所述的方法,其中,未被包含在所述基于云的自动语音识别器的所述词汇中的所述一个或多个术语包括安装在所述移动计算设备上的应用的名称。
4.根据权利要求1所述的方法,进一步包括:通过与所述基于云的自动语音识别器相关联的搜索引擎,使用所述话语的错误转录的一个或多个术语作为查询术语来生成所述一个或多个搜索结果。
5.根据权利要求1所述的方法,其中,所述基于云的自动语音识别器的所述词汇多于在所述移动计算设备上实现的所述自动语音识别器所使用的词汇。
6.根据权利要求1所述的方法,其中,在确定与所述个性化转录相关联的语音识别置信度评分不满足最小置信度阈值之后,提供用于发起与所述个性化转录相关联的所述话音动作的所述控件以用于输出。
7.根据权利要求1所述的方法,其中,所述用户的所述话语是人的姓名的话语;
其中,所述个性化转录是所述人的所述姓名;并且
其中,所述错误转录不是所述人的所述姓名。
8.根据权利要求1所述的方法,其中,所述一个或多个搜索结果包括指定使用所述话语的所述错误转录来识别的互联网资源的搜索结果。
9.根据权利要求1所述的方法,其中,所述个性化转录是由在所述移动计算设备或所述数字助理设备上实现的所述自动语音识别器使用第一语言模型来生成的,所述第一语言模型包括所述用户的用户特定信息;以及
其中,所述错误转录是由所述基于云的自动语音识别器使用第二语言模型来生成的,所述第二语言模型不包括所述用户的用户特定信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810238968.6/1.html,转载请声明来源钻瓜专利网。