[发明专利]基于语音和手势识别的多模态非触摸人机交互方法及系统在审
申请号: | 201510396954.3 | 申请日: | 2015-07-08 |
公开(公告)号: | CN104965592A | 公开(公告)日: | 2015-10-07 |
发明(设计)人: | 周伟达;梅微星;俞凯;朱苏 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G10L15/22 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 215123 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于语音和手势识别的多模态非触摸人机交互方法及系统,在基本的语音识别、手势识别的基础上,通过定义语音和手势的联合语义表示,基于语音识别和手势识别进行语义理解、融合以及多通道信息冲突处理,基于领域先验知识和对话上下文信息优化语音识别和手势识别的语义空间搜索空间,最终基于多轮次交互对用户意图进行理解,提供非常便利、自然的人机交互方式,具有可靠性高、交互成功率高和资源消耗低的优点。 | ||
搜索关键词: | 基于 语音 手势 识别 多模态非 触摸 人机交互 方法 系统 | ||
【主权项】:
一种基于语音和手势识别的多模态非触摸人机交互方法,其特征在于,包括以下步骤:S1、解析用户输入的语音或手势,确定用户意图;S2、根据用户意图制定语音与手势的联合语义表示,建立语义搜索空间和手势搜索空间的映射;S3、当语音和手势多路输入同时存在时,融合语音和手势识别的语义,根据对话的状态切换两种不同的输入通道,处理多路输入冲突时的语义解析;S4、优化缩小语音识别和手势识别的语义搜索空间,最终得到用户的真实意图。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510396954.3/,转载请声明来源钻瓜专利网。
- 上一篇:触控显示面板
- 下一篇:未读消息的展示方法和装置