[发明专利]基于深度的语境识别有效
申请号: | 201380030981.8 | 申请日: | 2013-04-15 |
公开(公告)号: | CN104620257B | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | T·E·多克尔;J·霍尔梅斯;J·克拉斯特;S·山本;P·瓦格赫菲纳扎里 | 申请(专利权)人: | 本田技研工业株式会社;艾吉3技术有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 苏娟,尹景娟 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 语境 识别 | ||
技术领域
本发明涉及使用姿势或手势信息识别语音命令以提高语音识别的准确性。
背景技术
车辆的驾驶员或乘客通常用手指或手使用开关、屏幕、键盘或其它输入机构来操作车辆中的各种设备。这样的输入机构可以用于操作例如导航系统、娱乐系统、空调系统或电话系统。有时,必须要对输入机构执行一系列复杂的操作来向设备发出期望的命令。然而对于驾驶员来说,将双手保持在方向盘上并且仅用短暂的时间通过手间歇地操作这些输入设备是更为可取的。根据操作的复杂性,在驾驶员能够执行期望的操作之前可能需要多次尝试来操作输入设备。
因此,使用较少的利用驾驶员的双手的操作模式是有利的。一种这样的操作模式是语音识别。语音识别是将声音信号转化成语音元素(例如,音素、词语以及句子)的处理过程。语音识别已经应用在从电话操作到车辆操作的各种领域。在语音识别系统中,由输入设备(例如,传声器)采集音频信号并将其转化成数字信号,然后使用一种或多种算法将其处理成包含在音频信号中的输出语音元素。根据应用领域,识别出的语音元素可以是语音识别的最终结果或者是用于进一步处理的中间信息。
在车辆中使用语音识别的问题之一是,类似的或者相同的言语命令可以用于不同的设备。类似的或相同的言语命令的共用导致言语命令中的歧义。例如,诸如“定位XYZ”的命令可表示在导航的情况下特定兴趣点(POI)的定位,而相同的命令还可表示娱乐系统中音轨的识别。如果用户的命令的语境没有被正确地识别,用户意图之外的操作可被车辆中的设备执行。
由于歧义性的言语命令所造成的无意操作以及随后的补救措施所花费的时间会损害用户体验并且导致用户恢复人工操作。
发明内容
本发明的实施例提供基于用户的姿势或手势识别言语命令的系统或方法。通过表示用户的姿势或手势的手势信息选择有可能被用户定为目标用于操作的多个设备中的一个或多个设备。根据所接收的手势信息选择与被用户定为目标的一个或多个设备关联的多个言语命令。使用选择的多个言语命令处理音频信号以确定用于操作所述一个或多个设备的设备命令。
在本发明的一种实施例中,深度相机用于拍摄至少一个深度影像。各个深度影像覆盖用户的至少部分并且包括表示从深度相机到用户的所述至少部分的距离的像素。处理所述至少一个深度影像以确定用户的姿势或手势。根据所识别的姿势或手势生成手势信息。
在一种实施例中,用户的所述至少部分包括用户的手或前臂。
在一种实施例中,深度相机安装在带有覆盖用户的视野的车辆中的头顶控制台中。
在一种实施例中,所述多个设备包括车辆中的至少导航系统以及娱乐系统。
在一种实施例中,手势信息表示用户的手或前臂是否定位在自深度相机的距离之内或者是否定位在自深度相机的所述距离之外。响应于表示手或前臂定位在所述距离之内的手势信息选择第一组言语命令。响应于表示手或前臂定位在所述距离之外的手势信息选择第二组言语命令。
在一种实施例中,第一组言语命令与在车辆中执行导航操作相关联。第二组言语命令与操作娱乐系统、空调控制系统或诊断系统相关联。
说明书中描述的特征和优点不是包括一切的,并且特别地,许多额外的特征和优点对于查看了附图、说明书以及权利要求书的本领域技术人员来说将是显而易见的。此外,应当注意的是,本说明书中使用的语言主要选择用于可读性和指导的目的,而不是选择用来描绘或限制发明主题。
附图说明
通过结合附图考虑下面的详细描述可以容易地理解本发明的教导。
图1A为根据一种实施例的装备有命令处理系统的车辆的侧视图。
图1B为根据一种实施例的图1A的车辆的俯视图。
图2为根据一种实施例的命令处理系统的框图。
图3为根据一种实施例的语音识别模块的框图。
图4为根据一种实施例的说明用于兴趣点的搜索区域的概念图。
图5为根据一种实施例的基于由相机拍摄的深度影像执行语音识别的方法的流程图。
具体实施方式
现在参考附图描述优选实施例,附图中相似的附图标记表示完全相同或功能上相似的元素。
说明书中提到的“一种实施例”或“实施例”表示结合所述实施例描述的特定的特征、结构或特性包括在至少一种实施例中。在说明书中多处出现的短语“在一种实施例中”不一定都指的是相同的实施例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于本田技研工业株式会社;艾吉3技术有限责任公司,未经本田技研工业株式会社;艾吉3技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380030981.8/2.html,转载请声明来源钻瓜专利网。