[发明专利]基于通道注意力的轻量化图卷积人体骨架动作识别方法有效
申请号: | 202110372148.8 | 申请日: | 2021-04-07 |
公开(公告)号: | CN113111760B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 刘成菊;党荣浩;陈启军;张恒 | 申请(专利权)人: | 同济大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/774;G06V10/82;G06N3/042;G06N3/0464;G06N3/08 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 通道 注意力 量化 图卷 人体 骨架 动作 识别 方法 | ||
1.一种基于通道注意力的轻量化图卷积人体骨架动作识别方法,其特征在于,包括以下步骤:
S1:获取视频影像中人体骨架的骨架序列信息;
S2:添加关节点索引信息,并计算骨架关节点的邻接矩阵;
S3:利用邻接矩阵以及引入通道注意力机制的残差GCN网络提取骨架序列的空间特征,所述的邻接矩阵在使用时进行随机失活处理;
S4:添加帧索引信息,并进行最大池化处理;
S5:利用一阶CNN网络提取骨架序列的时间特征;
S6:通过最大池化生成最终的特征序列,并得到识别分类结果;
步骤S4具体为:
首先将帧索引信息通过独热编码加到每一帧的空间特征中,再利用空间最大池化的将每一帧的关节信息进行聚合;
步骤S6具体为:
利用时间维度的最大池化生成最终的特征序列,再用全连接层和softmax层生成最终的分类结果。
2.根据权利要求1所述的一种基于通道注意力的轻量化图卷积人体骨架动作识别方法,其特征在于,步骤S1具体包括:
S11:对视频影像中的人体骨架建模并进行预处理,得到初始骨架序列信息;
S12:利用相邻帧之间作差的方式,获取初始骨架序列信息中的一阶信息、二阶信息和三阶信息;
S13:在保证数据初始维度不变的情况下,将一阶信息、二阶信息和三阶信息融合相加,得到最终的骨架序列信息。
3.根据权利要求1所述的一种基于通道注意力的轻量化图卷积人体骨架动作识别方法,其特征在于,步骤S2中,利用两个全连接层对骨架关节点之间相似性和亲和度的建模,通过內积计算得到邻接矩阵。
4.根据权利要求3所述的一种基于通道注意力的轻量化图卷积人体骨架动作识别方法,其特征在于,所述的邻接矩阵的计算式为:
其中,G为邻接矩阵,zt为第t帧的骨架序列信息,θ(zt,i)为双层全连接层θ对第t帧骨架序列信息zt进行编码后的数据,为双层全连接层对第t帧骨架序列信息zt进行编码后的数据,所述的双层全连接层θ和双层全连接层为两个权重不共享的双层连接层。
5.根据权利要求1所述的一种基于通道注意力的轻量化图卷积人体骨架动作识别方法,其特征在于,所述的引入通道注意力机制的残差GCN网络为多层结构,每一层分别包括GCN网络模块、残差连接模块和通道注意力机制模块,所述的通道注意力机制模块接入于GCN网络模块的输出和残差连接模块之间,所述的GCN网络模块的输入包括邻接矩阵和融合了关节点索引信息的骨架序列信息。
6.根据权利要求5所述的一种基于通道注意力的轻量化图卷积人体骨架动作识别方法,其特征在于,所述的引入通道注意力机制的残差GCN网络的每一层中输入GCN网络模块的邻接矩阵均采用前一个邻接矩阵经过随机失活之后的结果。
7.根据权利要求5所述的一种基于通道注意力的轻量化图卷积人体骨架动作识别方法,其特征在于,所述的通道注意力机制模块首先通过全局平局池化层聚合每个通道的信息,再通过利用Relu层进行非线性激活的两个全连接层,最后通过sigmoid层得到每个通道的权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110372148.8/1.html,转载请声明来源钻瓜专利网。