[发明专利]一种智能机器人的多模态融合自然交互方法、系统及介质有效

专利信息
申请号: 202210838251.1 申请日: 2022-07-18
公开(公告)号: CN114995657B 公开(公告)日: 2022-10-21
发明(设计)人: 李树涛;宋启亚;孙斌 申请(专利权)人: 湖南大学
主分类号: G06F3/01 分类号: G06F3/01;G06K9/62;G06N3/00;G06N20/00;G06N3/04;G06N5/04;B25J11/00
代理公司: 湖南兆弘专利事务所(普通合伙) 43008 代理人: 谭武艺
地址: 410082 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 智能 机器人 多模态 融合 自然 交互 方法 系统 介质
【说明书】:

发明公开了一种智能机器人的多模态融合自然交互方法、系统及介质,本发明方法包括根据音频数据、视觉数据及距离数据等多种模态交互特征进行多模态融合意图理解以确定目标交互对象的交互意愿,并执行对目标交互对象执行交互管理,包括用户状态管理、交互状态跟踪以及情感化交互决策;基于情感化交互决策的结果生成面向目标交互对象的交互反馈结果,并针对交互反馈结果执行交互反馈结果生成并输出。本发明能够结合多种模态的用户交互特征提升意图理解、交互决策和反馈生成等环节的交互准确度,能根据个人情况和即时状态做出因人而异的类人情感化个性化交互反馈,提升机器人自然交互的用户体验。

技术领域

本发明涉及人工智能和人机交互技术,具体涉及一种智能机器人的多模态融合自然交互方法、系统及介质。

背景技术

机器人被誉为“制造业皇冠顶端的明珠”,是衡量一个国家科技创新和高端制造业水平的重要标志,世界各国均将发展智能机器人产业上升到国家战略层面。其中服务机器人直接参与人们的日常生活,通过与人类交互获取任务进而实现服务功能,因此,人机自然交互技术是服务机器人的核心技术之一。机器人自然交互的最终目标是实现类似人与人交流的人机自然交互,让机器人理解和学习人的交流方式,从而最大程度减少用户学习和习惯培养成本,提升用户体验和服务机器人的工作效率。近年来随着语音技术取得重要的突破,以智能语音和自然语言处理技术为核心的人机对话技术广泛应用于各类服务机器人。然而在实际人与人之间交流中的感知、决策和表达均呈现出多模态的特点。人类具有视觉、听觉、触觉、嗅觉、味觉等多种模态感知能力,综合分析对方的语音、动作、表情才能理解其真实意图进而指定交互策略,并通过语言、动作、表情等不同方式进行反馈。目前服务机器人的交互系统以语音交互为主,反应用户面部表情、手体势动作的视频和深度等数据人机交互中的作用极为有限,一般仅用于人脸识别、唤醒和手势控制等辅助功能,语音和视觉信息的协同处理效率低,无法有效利用各个模态信息之间互补性。在实际的应用场景中易出现意图理解不准确、反馈表达僵硬平淡等问题,严重影响用户体验,限制了服务机器人产业的进一步发展。

发明内容

本发明要解决的技术问题:针对现有技术的上述问题,提供一种智能机器人的多模态融合自然交互方法、系统及介质,本发明旨在基于机器人获取的语音、视频和距离等多种模态的数据,在意图理解、交互决策和反馈生成等环节融合其中包含语言、情感和动作的识别结果,做出因人而异的类人情感化个性化交互反馈,以提升机器人自然交互的用户体验。

为了解决上述技术问题,本发明采用的技术方案为:

一种用于机器人的多模态融合自然交互方法,包括:

S1,获取目标交互对象的音频数据、视觉数据以及距离数据;

S2,根据从目标交互对象的音频数据、视觉数据以及距离数据中获得的多种模态的交互特征进行多模态融合意图理解,包括说话人识别以确定目标交互对象的用户ID、语言指向识别以确定目标交互对象说话指向本机器人的概率、用户指示动作识别以确定目标交互对象的动作指示目标,以及情感化意图识别以确定目标交互对象的情感状态;

S3,基于多模态融合意图理解的结果确定目标交互对象的交互意愿,并执行对目标交互对象执行交互管理,包括用户状态管理、交互状态跟踪以及情感化交互决策;

S4,基于情感化交互决策的结果生成面向目标交互对象的交互反馈结果,并针对交互反馈结果执行交互反馈结果生成并输出,所述交互反馈结果包括语言文本、语音、动作、表情中的部分或全部。

可选地,步骤S2中说话人识别所采用的多种模态的交互特征包括:基于目标交互对象的音频数据提取得到的声纹特征Fw,基于目标交互对象的视觉数据提取得到的人脸特征Fi;所述说话人识别包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210838251.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top