[发明专利]多模态融合的动作识别方法、装置及计算机可读存储介质在审

专利信息
申请号: 201810877125.0 申请日: 2018-08-03
公开(公告)号: CN110795973A 公开(公告)日: 2020-02-14
发明(设计)人: 刘家瑛;蒋鸿达;宋思捷;厉扬豪;郭宗明 申请(专利权)人: 北京大学;北大方正集团有限公司;北京北大方正电子有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06N3/04
代理公司: 11205 北京同立钧成知识产权代理有限公司 代理人: 张芳;刘芳
地址: 100871*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 多模态 神经网络模型 单模态 训练模型 训练数据 预设 计算机可读存储介质 多模态数据 动作识别 流动连接 识别设备 添加信息 融合
【说明书】:

发明提供一种多模态融合的动作识别方法、装置及计算机可读存储介质,方法包括:通过预设的单模态待训练数据对至少一个单模态待训练模型进行训练,获得至少一个单模态神经网络模型;在任意两个所述单模态神经网络模型之间添加信息流动连接,获得多模态待训练模型;通过预设的多模态待训练数据对所述多模态待训练模型进行训练,获得多模态神经网络模型;将待识别多模态数据添加至所述多模态神经网络模型中进行识别。从而能够实现对多模态待识别设备的处理,提高神经网络模型的性能。

技术领域

本发明涉及计算机领域,尤其涉及一种多模态融合的动作识别方法、装置及计算机可读存储介质。

背景技术

随着科技的发展,用于认知的人工智能得到了很大的发展,应用新颖的材料和先进的技术,认知的能力也有了显著地进步,从环境的认知,到人体的认知,从静态的认知,到动态的认知。对于认知而言,一个重要环节就是对人体的认知,利用计算机视觉的人工智能在实际的认知中,动作的识别是其中比较重要的一个部分。人体的动作是指身体的活动或行动,在日常的生活,人体本身就是一个动态的生活过程,所谓的静态也只是动态的一个衔接过程。因而,提高认知的能力,其中的一个大问题就是人体动作的识别研究。

为了实现对动作的识别,现有技术中一般都是建立动作识别网络模型,并对其进行训练,后续可以将待识别数据添加至动作识别网络模型中进行识别。

但是,随着深度摄像机的发展,可以获取的视频信息越来越丰富,除传统的RGB视频之外,深度视频、红外视频、人体骨架视频等视频模态也更易获得。不同模态的视频具有不同的特征,以深度视频为例,相比较RGB视频,深度视频去除了纹理信息,但增加了第三维的信息,在刻画动作时具有更好的空域表现能力。然而,上述方法只能够实现对一种模态的数据进行动作识别,由于多模态数据在表现形式上的差异性,不同模态间互补信息的挖掘依然存在困难。

发明内容

本发明提供一种多模态融合的动作识别方法、装置及计算机可读存储介质,用于解决现有技术中由于多模态数据在表现形式上的差异性,不同模态的待识别数据无法进行动作识别的技术问题。

本发明的第一个方面是提供一种多模态融合的动作识别方法,包括:

通过预设的单模态待训练数据对至少一个单模态待训练模型进行训练,获得至少一个单模态神经网络模型;

在任意两个所述单模态神经网络模型之间添加信息流动连接,获得多模态待训练模型;

通过预设的多模态待训练数据对所述多模态待训练模型进行训练,获得多模态神经网络模型;

将待识别多模态数据添加至所述多模态神经网络模型中进行识别。

本发明的另一个方面是提供一种多模态融合的动作识别装置,包括:

第一训练模块,用于通过预设的单模态待训练数据对至少一个单模态待训练模型进行训练,获得至少一个单模态神经网络模型;

连接模块,用于在任意两个所述单模态神经网络模型之间添加信息流动连接,获得多模态待训练模型;

第二训练模块,用于通过预设的多模态待训练数据对所述多模态待训练模型进行训练,获得多模态神经网络模型;

识别模块,用于将待识别多模态数据添加至所述多模态神经网络模型中进行识别。

本发明的又一个方面是提供一种多模态融合的动作识别装置,包括:存储器,处理器;

存储器;用于存储所述处理器可执行指令的存储器;

其中,所述处理器被配置为由所述处理器执行如上述的多模态融合的动作识别方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北大方正集团有限公司;北京北大方正电子有限公司,未经北京大学;北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810877125.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top