[发明专利]基于骨骼的图注意力网络动作识别方法及系统有效

专利信息
申请号: 202010128728.8 申请日: 2020-02-28
公开(公告)号: CN111310707B 公开(公告)日: 2023-06-20
发明(设计)人: 贺家凯;周风余;黄晴晴;赵阳;刘美珍;尹磊 申请(专利权)人: 山东大学
主分类号: G06V40/20 分类号: G06V40/20;G06V10/62;G06V10/82;G06N3/049;G06N3/048;G06N3/084
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 李圣梅
地址: 250061 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 骨骼 注意力 网络 动作 识别 方法 系统
【权利要求书】:

1.基于骨骼的图注意力网络动作识别方法,其特征是,包括:

对获取的动作数据集进行预处理,构建图数据;具体为:

从骨骼序列中获取原始身体数据;

从原始骨架序列中获取去噪数据;

将三个连续帧作为输入序列,每一帧之间根据人体的物理连接进行骨骼间的连接,相邻帧的连接,以同一个点进行时间上的连接;

输入序列为P×T×N×3,其中T=T0-2,N=N0×3,T0为原始序列的帧数,N0为原始序列的关节数,P为每个序列中演员的数量,T为组合之后输入序列的帧数,N为每帧的关节数量,3为每个关节的特征数x,y,z;

构建基于图注意力网络的骨骼动作识别神经网络,网络由归一化层,第一GAT层,激活函数ELU1,第二GAT层,激活函数ELU2,第三GAT层,激活函数sigmoid,全局池化层,全连接层组成;3层GAT中,第一GAT层的注意力头K=8,每个头输出特征为8,总输出维度为64;GAT层2的注意力头K=8,每个头输出特征为16,总输出维度为128;GAT层3的注意力头K=8,每个头输出特征为32,总输出维度为256;基本设置为3*64*1、64*128*1、128*256*1,每层中的数据第一位数代表输入通道,第二位数代表输出通道,第三位数代表步长,将获取的时空特征连接到一个全连接层,再通过softmax进行动作分类;单层GAT的输入是节点特征的集合:

ht={ht,1,ht,2,...,ht,N},ht,i∈RF,t∈T,N是节点的数量,F是每个节点的特征数量,T是一个序列中视频帧的数量;

输出结果节点特征的新集合:

计算公式如下:

其中,||代表连接,是正则化的注意力系数,Wk是对应的输入线性变换的权矩阵,Ni是节点i的邻居节点的集合;使用基于图注意力的方法对骨骼的时空信息进行建模,根据不同节点的重要性进行注意力标注,并提取骨骼数据的时空信息;

用训练集训练网络,优化参数,得到基于骨骼的图注意力动作识别网络;

将测试集输入到优化后的网络进行预测,得到对应的动作类别;

所述网络训练、调优的方法为反向传播算法,选择交叉熵为损失函数,以top1、top5衡量准确率,使用Adam优化器为优化函数;

权重初始化,加载数据、模型、优化器,直到所述分类层softmax输出的损失函数值下降并收敛时结束训练。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010128728.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top