[发明专利]使用分类器将音频话语映射至动作有效

申请号：	201380052230.6	申请日：	2013-06-26
公开（公告）号：	CN104704556B	公开（公告）日：	2017-05-17
发明（设计）人：	P·J·莫雷诺门吉巴;M·詹舍;F·比亚迪	申请（专利权）人：	谷歌公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/22
代理公司：	北京市柳沈律师事务所11105	代理人：	邵亚丽
地址：	美国加利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	使用分类音频话语映射动作
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

背景技术

除非这里以其它方式指出，该部分中所描述的素材针对本申请的权利要求而言并非现有技术，也并不由于包括在该部分之中而被承认其构成现有技术。

诸如移动电话和平板电脑之类的计算设备在近年来已经越来越流行。对于用户而言，计算设备提供了各种服务，包括由诸如媒体播放器、个人信息管理器和web浏览器之类的软件应用所提供的那些服务。为了向用户提供有所提升的益处，一些计算设备可以基于从用户所接收的音频话语(话语)而发起与这些服务或其它服务相关的动作。

发明内容

在一个方面，一种说明性计算设备包括具有输入组件的用户接口。该计算设备进一步包括处理器和具有存储于其上的程序指令的计算机可读存储介质，当该程序指令被该处理器所执行时使得该计算设备执行操作的集合，该集合包括经由该输入组件接收话语；基于该话语确定文本串；基于该文本串确定串特征矢量；从分类器集合中选择目标分类器，其中基于确定该目标分类器的串特征标准对应于该串特征矢量的至少一个串特征而选择该目标分类器；以及发起对应于该目标分类器的目标动作。

在另一个方面，一种说明性方法包括由计算设备接收音频话语；基于该话语确定文本串；基于该文本串确定串特征矢量；接收传感器数据；基于该传感器数据确定传感器特征矢量；从分类器集合中选择目标分类器，其中基于确定该目标分类器的串特征标准对应于该串特征矢量的至少一个串特征并且该目标分类器的传感器特征标准对应于该传感器特征矢量中的至少一个传感器特征而选择该目标分类器；以及发起对应于该目标分类器的目标动作。

在另一个方面，一种说明性计算机可读存储介质具有存储于其上的程序指令，当该程序指令由计算设备所执行时使得该计算设备执行以下操作集合，该操作集合包括接收音频话语；基于该话语确定文本串；基于该文本串确定串特征矢量；接收传感器数据；基于该传感器数据确定传感器特征矢量；从分类器集合中选择目标分类器，其中基于确定该目标分类器的串特征标准对应于该串特征矢量的至少一个串特征并且该目标分类器的传感器特征标准对应于该传感器特征矢量中的至少一个传感器特征而选择该目标分类器；并且发起对应于该目标分类器的目标动作。

在另一个方面，一种说明性方法包括接收话语；基于该话语确定文本串；基于该文本串确定串特征矢量；接收传感器数据；基于该传感器数据确定传感器特征矢量；确定所识别的动作；并且生成分类器，其中该分类器具有对应于该串特征矢量中的至少一个串特征的串特征标准，具有对应于该传感器特征矢量中的至少一个传感器特征的传感器特征标准，并且对应于所识别的动作。

附图说明

图1是说明性计算设备的简化框图。

图2是示出说明性方法的训练功能组件的流程图。

图3是示出说明性方法的运行时间功能组件的流程图。

具体实施方式

除非以其它方式所指出，否则，贯穿本公开，术语“一”或“一个”是指“至少一个”，并且术语“该”是指“该至少一个”。

这里所描述的计算设备和方法的说明性实施例并非意在作为限制。将容易理解的是，所公开的计算设备和方法的某些方面可以以各种不同配置进行布置和组合，所有这些都在这里得以被预期。

在以下详细描述中，对形成其一部分的附图加以参考。详细描述、附图和权利要求中所描述的说明性实施例并非意在作为限制。可以采用其它实施例，可以进行其它变化，而并不背离本文所给出的主题的精神或范围。将容易理解的是，本公开的方面可以以各种不同配置进行布置、替换、组合、划分和设计，所有这些都在这里得以被预期。

I.概述

在基于计算机的话音识别的环境中，将话语(例如，“呼叫妈妈”)映射至特定动作(例如，向被指定为“妈妈”的联系人进行电话呼叫)可能涉及到两个阶段。在第一阶段，该话语被映射至文本串。在第二阶段，该文本串被映射至动作。由于这些阶段中的每一个中所涉及到的计算复杂度，在经常被称作“云”计算的布置中，一些计算设备可能把每个阶段中所涉及到的一个或多个功能外包给可能更适于应对这样的复杂计算的服务器计算设备(服务器)。然而，除其它之外，在第二阶段中使用基于特征的分类器(分类器)可以降低计算复杂度和/或可以减少或消除计算设备将所选择功能外包给服务器的需求。

对于诸如移动电话的计算设备而言，可能期望在没有基于云的服务器的支持情况下提供话音识别特征。因此，示例实施例可以包括一种能够连同准确的结果一起自动提供这样的话音识别功能但是没有来自基于云的服务器的支持的移动电话。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于谷歌公司，未经谷歌公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201380052230.6/2.html，转载请声明来源钻瓜专利网。

上一篇：用于数据擦除的旋转头数据存储和检索系统和方法
下一篇：半导体装置和显示装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]使用分类器将音频话语映射至动作有效

专利文献下载