[发明专利]使用分类器将音频话语映射至动作有效
申请号: | 201380052230.6 | 申请日: | 2013-06-26 |
公开(公告)号: | CN104704556B | 公开(公告)日: | 2017-05-17 |
发明(设计)人: | P·J·莫雷诺门吉巴;M·詹舍;F·比亚迪 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 分类 音频 话语 映射 动作 | ||
背景技术
除非这里以其它方式指出,该部分中所描述的素材针对本申请的权利要求而言并非现有技术,也并不由于包括在该部分之中而被承认其构成现有技术。
诸如移动电话和平板电脑之类的计算设备在近年来已经越来越流行。对于用户而言,计算设备提供了各种服务,包括由诸如媒体播放器、个人信息管理器和web浏览器之类的软件应用所提供的那些服务。为了向用户提供有所提升的益处,一些计算设备可以基于从用户所接收的音频话语(话语)而发起与这些服务或其它服务相关的动作。
发明内容
在一个方面,一种说明性计算设备包括具有输入组件的用户接口。该计算设备进一步包括处理器和具有存储于其上的程序指令的计算机可读存储介质,当该程序指令被该处理器所执行时使得该计算设备执行操作的集合,该集合包括经由该输入组件接收话语;基于该话语确定文本串;基于该文本串确定串特征矢量;从分类器集合中选择目标分类器,其中基于确定该目标分类器的串特征标准对应于该串特征矢量的至少一个串特征而选择该目标分类器;以及发起对应于该目标分类器的目标动作。
在另一个方面,一种说明性方法包括由计算设备接收音频话语;基于该话语确定文本串;基于该文本串确定串特征矢量;接收传感器数据;基于该传感器数据确定传感器特征矢量;从分类器集合中选择目标分类器,其中基于确定该目标分类器的串特征标准对应于该串特征矢量的至少一个串特征并且该目标分类器的传感器特征标准对应于该传感器特征矢量中的至少一个传感器特征而选择该目标分类器;以及发起对应于该目标分类器的目标动作。
在另一个方面,一种说明性计算机可读存储介质具有存储于其上的程序指令,当该程序指令由计算设备所执行时使得该计算设备执行以下操作集合,该操作集合包括接收音频话语;基于该话语确定文本串;基于该文本串确定串特征矢量;接收传感器数据;基于该传感器数据确定传感器特征矢量;从分类器集合中选择目标分类器,其中基于确定该目标分类器的串特征标准对应于该串特征矢量的至少一个串特征并且该目标分类器的传感器特征标准对应于该传感器特征矢量中的至少一个传感器特征而选择该目标分类器;并且发起对应于该目标分类器的目标动作。
在另一个方面,一种说明性方法包括接收话语;基于该话语确定文本串;基于该文本串确定串特征矢量;接收传感器数据;基于该传感器数据确定传感器特征矢量;确定所识别的动作;并且生成分类器,其中该分类器具有对应于该串特征矢量中的至少一个串特征的串特征标准,具有对应于该传感器特征矢量中的至少一个传感器特征的传感器特征标准,并且对应于所识别的动作。
附图说明
图1是说明性计算设备的简化框图。
图2是示出说明性方法的训练功能组件的流程图。
图3是示出说明性方法的运行时间功能组件的流程图。
具体实施方式
除非以其它方式所指出,否则,贯穿本公开,术语“一”或“一个”是指“至少一个”,并且术语“该”是指“该至少一个”。
这里所描述的计算设备和方法的说明性实施例并非意在作为限制。将容易理解的是,所公开的计算设备和方法的某些方面可以以各种不同配置进行布置和组合,所有这些都在这里得以被预期。
在以下详细描述中,对形成其一部分的附图加以参考。详细描述、附图和权利要求中所描述的说明性实施例并非意在作为限制。可以采用其它实施例,可以进行其它变化,而并不背离本文所给出的主题的精神或范围。将容易理解的是,本公开的方面可以以各种不同配置进行布置、替换、组合、划分和设计,所有这些都在这里得以被预期。
I.概述
在基于计算机的话音识别的环境中,将话语(例如,“呼叫妈妈”)映射至特定动作(例如,向被指定为“妈妈”的联系人进行电话呼叫)可能涉及到两个阶段。在第一阶段,该话语被映射至文本串。在第二阶段,该文本串被映射至动作。由于这些阶段中的每一个中所涉及到的计算复杂度,在经常被称作“云”计算的布置中,一些计算设备可能把每个阶段中所涉及到的一个或多个功能外包给可能更适于应对这样的复杂计算的服务器计算设备(服务器)。然而,除其它之外,在第二阶段中使用基于特征的分类器(分类器)可以降低计算复杂度和/或可以减少或消除计算设备将所选择功能外包给服务器的需求。
对于诸如移动电话的计算设备而言,可能期望在没有基于云的服务器的支持情况下提供话音识别特征。因此,示例实施例可以包括一种能够连同准确的结果一起自动提供这样的话音识别功能但是没有来自基于云的服务器的支持的移动电话。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380052230.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于数据擦除的旋转头数据存储和检索系统和方法
- 下一篇:半导体装置和显示装置