[发明专利]一种基于图卷积神经网络的人类动作识别方法在审
申请号: | 202011600579.7 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112633209A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 毛克明;李翰鹏 | 申请(专利权)人: | 东北大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京君泊知识产权代理有限公司 11496 | 代理人: | 李丹 |
地址: | 110000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图卷 神经网络 人类 动作 识别 方法 | ||
1.一种基于图卷积神经网络的人类动作识别方法,其特征在于,包括如下步骤:
步骤1:准备人类动作视频数据,并进行标注,并根据不同种类的动作对视频标签进行标注;
步骤2:使用openpose姿态估计算法对人类动作视频数据进行骨骼关键点特征的提取,然后通过骨骼点主流网络计算相邻帧骨骼关键点变化速度并进行特征拼接;对骨骼关键点进行筛选并通过角度分支网络计算筛选的骨骼关键点的夹角并进行特征拼接;
步骤3:将拼接好的数据传入图神经网络;
步骤4:将图卷积从空间域扩展到时间域;
步骤5:使用一个交叉注意力模型来增强网络的性能;
步骤6:构建由九个时空卷积模块加全局池化层,和Softmax层组成的图卷积神经网络,全局池化层作用为对图结构中的节点特征进行汇总,以将节点级的特征升级为图级别的特征,再通过Softmax层输出人类动作视频中人的动作编号。
2.根据权利要求1所述的基于图卷积神经网络的人类动作识别方法,其特征在于,所述步骤2具体包括:
步骤2.1:首先对视频进行裁剪,保证每个视频中人类位于视频中央;
步骤2.2:使用openpose姿态估计算法进行人体骨骼关键点提取,对视频S取15个等分点S=(T1,...,T2,...,T3,...,T4,...,T5,...,T6,....,T15),将每个点的骨骼关键点数据保存下来,每次提取出18个骨骼关键点,分别代表人体的18个部位,将单帧视频的长度设置为L,视频宽度设为W,对提取的骨骼关键点坐标进行归一化处理,用Tn表示第n帧的骨骼关键点数据,那么归一化后的Tn:
其中xn为第n个骨骼关键点的横坐标,yn为第n个骨骼关键点的纵坐标,Tn即为归一化后的第n帧的骨骼关键点坐标;
步骤2.3:计算相邻帧关键点变化速度,速度Vn:
Vn=((x1n-x1n-1,y1n-y1n-1),(x2n-x2n-1,y2n-y2n-1),...,(x18n-x18n-1,y18n-y18n-1));其中x和y的具体意义与步骤2.2中相同;获得速度V之后进行特征拼接,拼接后的总特征Dn:
Dn=Cancate(Tn,Tn′,Vn);
其中Tn和T'n分别表示在n时刻侧面和前面获得的归一化骨骼关键点坐标,Cancate函数表示对括号内变量进行拼接;
步骤2.4:对openpose提取的的骨骼关键点进行筛选,保存左膝盖、右膝盖、左腰、右腰、左肩膀、右肩膀、左手肘、右手肘;
步骤2.5:计算夹角:
(1)膝盖:
(2)腰:
(3)肩膀:
(4)手肘:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011600579.7/1.html,转载请声明来源钻瓜专利网。