[发明专利]一种基于诱导式深度学习的动作识别方法有效
申请号: | 201910364764.1 | 申请日: | 2019-04-30 |
公开(公告)号: | CN110084214B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 韩云;吕小英 | 申请(专利权)人: | 内江师范学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 李春霖 |
地址: | 641112 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 诱导 深度 学习 动作 识别 方法 | ||
本发明公开了一种基于诱导式深度学习的动作识别方法,属于人工智能领域,首先利用相机获取用于动作识别的视频序列;再对所述视频序列进行预处理,得到一种或多种不同特性的信息源序列;接着选择一种或多种类型的特征,构建提取所选类型特征的深度学习网络;最后将所述信息源序列输入所述深度学习网络中提取特征,得到所述视频序列的动作类型;本方法所需数据量相对较少,训练过程更加快,更容易收敛,且识别精度高。
技术领域
本发明涉及人工智能领域,具体涉及一种基于诱导式深度学习的动作识别方法。
背景技术
目前在人工智能领域,对动作进行识别的常用方法可分为两类:一类是基于传统机器学习的方法,它的核心是以人工构建的特征为主,并结合训练的分类器来实现动作识别;第二类是基于当前流行的深度学习的方法,其中,深度学习以目标为导向,以大量的训练数据为基础,不仅能训练分类器,还同时学习特征,具有很好的效果。
但是,目前利用深度学习进行动作识别还存在以下问题:
1)数据利用率低,需要大量的数据才能完成训练。现在的深度学习不仅需要大量的训练数据,还要求训练数据必须具有较好的覆盖性和平衡性。也就是,对于训练数据中没有出现的情况,深度学习往往会失效。
2)深度学习性能的提升过分依赖网络结构的修改和训练数据量的增大。当前利用深度学习进行动作识别,为了获得更好的效果,在遇到问题时,常常通过修改深度学习算法的结构以及增加训练数据量来解决。这将导致两方面的问题:第一、进一步加大了对数据量的需求;第二、让深度学习去完成自身并不擅长的工作,使得训练过程不易收敛、所需时间长、耗费的计算资源多。
发明内容
本发明的目的在于:提供一种基于诱导式深度学习的动作识别方法,解决了目前利用深度学习来进行动作识别时,训练数据量大、性能较差的技术问题。
本发明采用的技术方案如下:
一种基于诱导式深度学习的动作识别方法,包括以下步骤
步骤1:利用相机获取用于动作识别的视频序列;
步骤2:对所述视频序列进行预处理,得到一种或多种不同特性的信息源序列;
步骤3:选择一种或多种类型的特征,构建提取所选类型特征的深度学习网络;
步骤4:将所述信息源序列输入所述深度学习网络中提取特征,得到所述视频序列的动作类型。
进一步的,所述步骤2中,所述预处理得到的信息源序列包括降采样后的RGB视频流以及位置校正后的人体关节点信息流。
进一步的,所述位置校正包括对单个关节点遗失进行的校正以及对肢体部位遗失进行的校正。
进一步的,所述对单个关节点遗失进行校正的步骤包括:
步骤211:获取人体关节点信息流中T时刻图像上遗失的关节点A和与所述关节点A相连接的关节点B;
步骤212:获取T时刻图像前后的N帧图像,定义所述关节点A对所述关节点B的变化范围为Δx,y,则
其中x表示关节点的横坐标,y表示关节点的纵坐标,t表示人体关节点信息流的时间序列,Ax,y(t)表示关节点A在时刻t的位置,Bx,y(t)表示关节点B在时刻t的位置;
步骤213:利用所述变化范围得到在T时刻关节点A的位置为:Ax,y(T)=Bx,y(T)+Δx,y(2),Bx,y(T)表示关节点B在T时刻的位置;
进一步的,所述对肢体部位遗失进行校正的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内江师范学院,未经内江师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910364764.1/2.html,转载请声明来源钻瓜专利网。