[发明专利]基于骨骼的图注意力网络动作识别方法及系统有效
申请号: | 202010128728.8 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111310707B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 贺家凯;周风余;黄晴晴;赵阳;刘美珍;尹磊 | 申请(专利权)人: | 山东大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/62;G06V10/82;G06N3/049;G06N3/048;G06N3/084 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李圣梅 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 骨骼 注意力 网络 动作 识别 方法 系统 | ||
1.基于骨骼的图注意力网络动作识别方法,其特征是,包括:
对获取的动作数据集进行预处理,构建图数据;具体为:
从骨骼序列中获取原始身体数据;
从原始骨架序列中获取去噪数据;
将三个连续帧作为输入序列,每一帧之间根据人体的物理连接进行骨骼间的连接,相邻帧的连接,以同一个点进行时间上的连接;
输入序列为P×T×N×3,其中T=T0-2,N=N0×3,T0为原始序列的帧数,N0为原始序列的关节数,P为每个序列中演员的数量,T为组合之后输入序列的帧数,N为每帧的关节数量,3为每个关节的特征数x,y,z;
构建基于图注意力网络的骨骼动作识别神经网络,网络由归一化层,第一GAT层,激活函数ELU1,第二GAT层,激活函数ELU2,第三GAT层,激活函数sigmoid,全局池化层,全连接层组成;3层GAT中,第一GAT层的注意力头K=8,每个头输出特征为8,总输出维度为64;GAT层2的注意力头K=8,每个头输出特征为16,总输出维度为128;GAT层3的注意力头K=8,每个头输出特征为32,总输出维度为256;基本设置为3*64*1、64*128*1、128*256*1,每层中的数据第一位数代表输入通道,第二位数代表输出通道,第三位数代表步长,将获取的时空特征连接到一个全连接层,再通过softmax进行动作分类;单层GAT的输入是节点特征的集合:
ht={ht,1,ht,2,...,ht,N},ht,i∈RF,t∈T,N是节点的数量,F是每个节点的特征数量,T是一个序列中视频帧的数量;
输出结果节点特征的新集合:
计算公式如下:
其中,||代表连接,是正则化的注意力系数,Wk是对应的输入线性变换的权矩阵,Ni是节点i的邻居节点的集合;使用基于图注意力的方法对骨骼的时空信息进行建模,根据不同节点的重要性进行注意力标注,并提取骨骼数据的时空信息;
用训练集训练网络,优化参数,得到基于骨骼的图注意力动作识别网络;
将测试集输入到优化后的网络进行预测,得到对应的动作类别;
所述网络训练、调优的方法为反向传播算法,选择交叉熵为损失函数,以top1、top5衡量准确率,使用Adam优化器为优化函数;
权重初始化,加载数据、模型、优化器,直到所述分类层softmax输出的损失函数值下降并收敛时结束训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010128728.8/1.html,转载请声明来源钻瓜专利网。