[发明专利]语音动作偏置系统有效
申请号: | 201910226611.0 | 申请日: | 2017-05-31 |
公开(公告)号: | CN110070860B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 王波;S.维穆里;B.J.詹姆斯;P.K.古普塔;S.B.霍夫曼 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/22 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王新宇 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 动作 偏置 系统 | ||
1.一种由计算机实现的方法,包括:
接收用于新语音动作的用户发声,用户发声在与用户设备分离并通信地耦合到用户设备的语音动作系统中接收,该用户设备安装有与用于执行语音动作的触发词语相关联的应用;
使用该语音动作系统确定该用户发声的多个候选转录;
使用该语音动作系统确定多个候选转录中的任一个是否包含用于触发新语音动作的一个或多个触发词语;以及
基于包含的所述一个或多个触发词语来偏置语音动作系统,使得语音动作系统偏好与新语音动作相关联的多个候选转录中的一个,其中当语音动作系统从用户设备接收用户发声时,语音动作系统向用户设备发送动作触发,动作触发使应用执行该新语音动作,
其中该新语音动作是用于一个或多个应用的。
2.如权利要求1所述的由计算机实现的方法,其中,偏置语音动作系统以偏好多个候选转录中的一个包括:调整由语音动作系统使用的语言模型以使得使用经调整的语言模型的语音动作系统具有提高的检测到新语音动作的触发词语的可能性。
3.如权利要求1所述的由计算机实现的方法,其中,使应用执行该新语音动作包括触发所述应用执行与所述新语音动作相关联的动作。
4.如权利要求1所述的由计算机实现的方法,包括:
由语音动作系统确定安装在用户设备上的应用与一个或多个其他语音动作兼容;
由所述语音动作系统识别用于触发所述应用执行一个或多个其他语音动作的一个或多个触发词语;以及
由所述语音动作系统对所述新语音动作和所述一个或多个其他语音动作进行排名,其中所述语音动作系统是至少基于所述排名被偏置的。
5.如权利要求4所述的由计算机实现的方法,包括:
接收指示所述用户设备的状态或安装在所述用户设备上的所述应用的状态的信息;并且
至少基于接收到的指示所述用户设备的状态或安装在所述用户设备上的所述应用的状态的信息对所述新语音动作和所述一个或多个其他语音动作进行排名。
6.如权利要求1所述的由计算机实现的方法,其中语音动作系统基于所接收的用户发声生成包括节点和在节点之间的边缘的图形,并且其中使用所生成的图形确定多个候选转录。
7.如权利要求6所述的由计算机实现的方法,其中节点对应于词语之间的连接,其中边缘对应于与来自用户发声的音频数据的一部分对应的候选词语,并且其中节点或边缘或两者与概率相关联,该概率指示所确定的用户发声包括与该节点或边缘相对应的特定词语或词语之间的连接的置信。
8.如权利要求7所述的由计算机实现的方法,还包括对确定的多个候选转录进行排名,其中偏置语音动作系统包括改变该排名以偏好与新语音动作关联的候选转录。
9.如权利要求7所述的由计算机实现的方法,其中偏置语音动作系统包括基于与合格语音动作相对应的触发词语的存在或缺乏而调整各个候选转录的概率。
10.如权利要求9所述的由计算机实现的方法,其中调整概率是针对各个节点或边缘完成的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910226611.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法及装置
- 下一篇:信息处理装置和信息处理方法