[发明专利]基于车辆的对乘员音频和可视输入的确定有效

申请号：	201180075888.X	申请日：	2011-12-26
公开（公告）号：	CN104011735B	公开（公告）日：	2018-03-30
发明（设计）人：	P·王;Y·张	申请（专利权）人：	英特尔公司
主分类号：	G06K9/00	分类号：	G06K9/00;G10L15/22
代理公司：	永新专利商标代理有限公司72002	代理人：	刘瑜,王英
地址：	美国加***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	描述了包括用于接收来自车辆的一个或多个乘员的音频数据和可视数据的操作的系统、装置、制品和方法。可以至少部分地基于所接收的可视数据来做出关于车辆的一个或多个乘员中的哪个与所接收的音频数据相关联的确定。
搜索关键词：	基于车辆乘员音频可视输入确定
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种计算机实现的方法，包括：接收音频数据，其中，所述音频数据包括来自车辆的一个或多个乘员的口语输入；至少部分地基于所接收的音频数据来执行话语识别，以识别正在说什么；接收可视数据，其中，所述可视数据包括所述车辆的所述一个或多个乘员的视频；至少部分地基于：至少部分地基于所接收的可视数据来对所述车辆的所述一个或多个乘员中的哪个与所接收的音频数据相关联的确定，以及在没有基于音频的发言者验证的情况下，通过至少部分地基于所接收的可视数据来对所述车辆的所述一个或多个乘员的唇部跟踪，来确定谁正在发言；至少部分地基于在没有基于音频的发言者验证的情况下对谁正在发言的基于可视数据的确定，来选择特定的发言者模型；至少部分地基于：对作为对所执行的话语识别操作的修改的适合于选定的特定的发言者模型的语音识别的执行，来确定正在说什么，其中，所执行的语音识别是至少部分地基于所执行的话语识别和对所述车辆中的所述一个或多个乘员中的哪一个与所接收的音频数据相关联的确定的；以及至少部分地基于所执行的语音识别来执行与所述车辆的操作相关联的用户命令。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于英特尔公司，未经英特尔公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201180075888.X/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于车辆的对乘员音频和可视输入的确定有效

专利文献下载