[发明专利]基于动态轻量高分辨率网络的人体姿态估计方法有效
申请号: | 202210243988.9 | 申请日: | 2022-03-14 |
公开(公告)号: | CN114333074B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 李群;张子屹;肖甫;张锋 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06N3/04;G06N3/08 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 张玉红 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 高分辨率 网络 人体 姿态 估计 方法 | ||
1.基于动态轻量高分辨率网络的人体姿态估计方法,其特征在于,所述方法的步骤为:
步骤1、获取人体姿态估计数据集,包括训练集和测试集,并对其进行数据预处理;
步骤2、构建新型人体姿态估计网络Dite-HRNet,所述新型人体姿态估计网络Dite-HRNet由1个高分辨率主干网络和3个不同分辨率的分支网络组成,主干网络和3个分支网络分别包含不同超参数配置的动态上下文模块和多尺度融合模块;所述新型人体姿态估计网络Dite-HRNet包含4个阶段,在第2、3、4阶段开始时,将3个分支网络逐一添加至主干网络,形成多分支并行的网络结构,相邻阶段之间经由过渡卷积模块使每个新添加的分支网络的输出具有前一个分支网络或主干网络1/2倍的分辨率和2倍的通道数量;
所述动态上下文模块为动态多尺度上下文模块或动态全局上下文模块,网络的第1阶段包含1个步长为2的3×3卷积层和1个动态全局上下文模块;网络的第2、3、4个阶段中的主干网络和分支网络由跨分辨率单元堆叠构成,每个单元包含2个动态多尺度上下文模块和1个多尺度融合模块;
主干网络全程保持高分辨率的特征输出,并通过多尺度融合模块将该高分辨率特征输出与来自所有分支网络的多种尺度下的特征输出进行重复跨分支融合来生成网络的最终输出;
步骤3、使用步骤1中得到的训练集数据,对所述新型人体姿态估计网络Dite-HRNet进行训练;
步骤4、使用步骤3训练得到的人体姿态估计网络模型在步骤1中得到的测试集数据上进行测试;
所述动态多尺度上下文模块和动态全局上下文模块均先使用通道分割操作将所有输入通道平均分成数量相等的2组,从而在模块内部形成2个分支,并在这2个分支上分别执行不同的操作,然后把2个分支的输出在通道维度上重新拼接,最后使用通道混洗来在具有不同特征表示的2组通道之间进行信息交换;
在所述动态全局上下文模块中,其中一个分支上依次执行1个步长为2的3×3动态深度卷积、1个全局上下文建模操作和1个1×1动态卷积,而另一个分支上则依次执行1个3×3动态深度卷积、1个全局上下文建模操作、1个1×1动态卷积和1个步长为2的3×3动态深度卷积;
在所述动态多尺度上下文模块中,其中一个分支上依次执行1个密集上下文建模操作、1个动态金字塔卷积和1个全局上下文建模操作,而另一个分支上不执行任何操作;
所述动态金字塔卷积的实施步骤为:
a)使用通道分割操作来将所有输入特征通道平均分成数量相等的
b)为每组通道都分配
c)根据各组通道的不同输入特征来为同一组通道上的
d)利用所述注意力权重对同一组通道上的
e)使用加权融合后的
f)把
d)使用通道混洗操作来在具有不同尺度特征表示的
所述注意力权重的计算步骤为:先将输入特征经过全局平均池化,得到一个特征向量,将此向量经过一个全连接层映射为一个
所述密集上下文建模操作的步骤为:在第
在高分辨率网络的第
其中,
对来自所有分支的池化后的特征进行特征拼接和上下文重排操作后,得到的新特征可以表示为:
其中,
经过重排的上下文特征分发回到其各自所属的分支网络上,并与原始特征进行上下文加权操作,得到最终的输出特征,第
其中,
所述全局上下文建模操作的步骤为:先通过自适应上下文池化操作将当前分支网络上的特征下采样至分辨率为1×1,然后依次进行上下文重排和上下文加权操作;第
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210243988.9/1.html,转载请声明来源钻瓜专利网。