[发明专利]语音动作偏置系统有效
申请号: | 201710398592.0 | 申请日: | 2017-05-31 |
公开(公告)号: | CN107767865B | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 王波;S.维穆里;B.J.詹姆斯;P.K.古普塔;S.B.霍夫曼 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 动作 偏置 系统 | ||
用于确定安装在用户设备上的软件应用与新语音动作兼容的方法、系统和装置,其中新语音动作是由软件应用的应用开发者指明的。识别用于触发软件应用执行新语音动作的一个或多个触发词语。将自动话音识别器偏置为相对于其他语音动作的触发词语更偏好所识别的新语音动作的触发词语。获得由偏置的自动话音识别器生成的发声的转录。确定由偏置的自动话音识别器生成的发声的转录包括所识别的触发词语中包括的特定触发词语。至少基于确定由偏置的自动话音识别器生成的发声的转录包括特定触发词语,触发新语音动作的执行。
技术领域
本说明书涉及语音动作,并且一种特定实现方式涉及语音动作检测技术。
背景技术
软件应用中的一个任务是用户在执行特定作业时与之交互的一个或多个活动的收集,其中每个活动是在软件应用中定义的。每个活动是活动类的一个实例,并且总体上集合中的一个或多个活动控制任务的执行的生命周期,使得在任务内执行的多个活动可允许用户执行该作业。在一些实现方式中,命令可与活动或者与活动有关的动作相关联,使得用户对该命令的提交可触发该活动或动作。特定的意图可被发射(fire)以触发活动的开始或动作的执行。从而,为了触发活动的开始或动作的执行,用户必须拥有关于跟用于发射与活动或动作相对应的意图的活动或动作相关联的命令的知识。
发明内容
本说明书描述了一种平台,用于将话音识别系统偏置为相对于其他词语更偏好用于新语音动作的触发词语。在本说明书中,新语音动作是由先前安装的软件应用的应用开发者指明的语音动作。应用开发者可使用该平台来提交定义新语音动作的信息,其中该信息指明先前已被发布并安装在一个或多个用户设备上的软件应用、当该新语音动作被用户发出并被话音识别系统识别时该应用执行的动作、用于触发该动作的触发词语以及该触发词语在其中可用来触发该应用中的该动作的情境。
应用开发者提交的情境可指明当该语音动作应当有效来触发该应用中的该动作时的用户设备状态。设备状态可包括例如哪个(或哪些)应用在前台操作(即,当前在设备的用户界面中活跃)或者在后台操作(即,当前在设备的用户界面中隐藏不可见),或者可包括关于应用的具体信息,例如哪个活动当前在运行、哪些活动被包括在活动栈上、当前运行的活动的状态或者栈上的一个或多个活动的状态,等等。
当应用开发者提交定义新语音动作的信息时,被设计为服务或工具的平台可验证定义新语音动作的信息以确定新语音动作是否与应用兼容,或者以其他方式确定新语音动作是否可被实现。如果新语音动作有效,则通过归纳(induct)定义新语音动作的信息,可以为该语音动作创建一被称为意图(intent)并且具有特定格式的被动数据结构的新实例。意图可指明定义新语音动作的信息中的一些或全部,例如应用、触发词语、响应于检测到该触发词语要触发的活动或动作以及该触发词语触发该活动或动作所必要的情境。随后可为该应用部署该语音动作,使得该语音动作对于该应用成为使能的语音动作,而无需对应用代码做出额外的更改来支持该语音动作。
一旦已部署了语音动作,操作用户设备的用户就可提供话音输入。用户设备可以提交关于用户设备的情境信息,并且情境信息和话音输入的转录(transcription)可用于识别意图并且触发所识别的意图。当意图被触发时,用于执行活动或动作的数据被确定,并且被发送到用户设备以响应于该语音输入而执行该活动或动作。
每个新语音动作与一个或多个触发词语相关联,这些触发词语的发音可与用于其他语音动作的触发词语相似,或者其发音可与不是语音动作的其他单词相似。从而,在一些实现方式中,系统可偏置自动话音识别器以使得自动话音识别器更有可能确定接收到的语音输入包括用于新语音动作的触发词语。为了偏置自动话音识别器,平台可确定用户设备的情境并且可偏置用于转录用户话音的自动话音识别器以识别对于该情境使能的触发词语。例如,在用户向用户设备提供口头输入之时,用户设备的情境或者安装在用户设备上的一个或多个应用的情境可被确定。随后可基于情境识别可用来被触发的语音动作,并且可调整自动话音识别器以对口头输入中的触发词语的识别进行偏置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710398592.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:工控机与传感器的一体化结构
- 下一篇:用于带头模块的引线接合电研磨导件