[发明专利]一种基于分割引导的人体姿态识别方法在审
申请号: | 202110726048.0 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113743189A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 张旻;陆继鹏;汤景凡;姜明 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分割 引导 人体 姿态 识别 方法 | ||
1.一种基于分割引导的人体姿态估计方法,其特征在于采用HRNet人体姿态估计的基本网络结构;HRNet包含4个阶段3个分支,每个分支捕获输入信号的不同尺度特征表示;每个阶段不同分支的特征会进行相互融合并将融合后的特征作为下一个阶段的输入;同时高分辨率分支的每一个阶段都融入一个分割引导机制,得到一个分割引导的HRNet;利用分割引导机制来逐步改善每个阶段产生的检测结果。
2.根据权利要求1所述的一种基于分割引导的人体姿态估计方法,其特征在于具体实现步骤如下:
步骤(1)在网络构建之前,为每个训练图像制作对应的二值化分割图S,并将二值化分割图S作为监督信号融入到网络中;
步骤(2)构建HRNet网络,并针对每个阶段的高分辨分支,添加一个分割引导模块用于预测二值化分割图,将输出的二值化分割图与高分辨率分支输出的特征图点乘后作为输出,该过程称之为分割引导机制;
步骤(3)添加分割引导机制后,得到多任务的人体姿态估计模型SG-HRNet;使用动态加权平均的多任务优化方法对模型SG-HRNet的参数进行训练,直至整个网络模型收敛。
3.根据权利要求2所述的一种基于分割引导的人体姿态估计方法,其特征在于步骤(1)具体实现如下:
1-1、计算训练图像位置p处的二值化分割值S(p)表示为:
其中,p为图像位置p处的二维位置向量(x,y),ρ为人体所有骨骼点集合,P为一个人体骨骼点的二维位置向量,||·||为欧几里得范数,r为半径;图像位置p处与任意人体骨骼点P的距离在r之内时为1,其余情况为0。
4.根据权利要求3所述的一种基于分割引导的人体姿态估计方法,其特征在于步骤(2)具体实现如下:
2-1、设fs是当前s阶段高分辨率分支的输出特征图,则用于预测分割图的特征通过Fs=ws*fs来计算,ws是需要被学习的权重矩阵;再通过卷积操作将通道数降为1;
2-2、通过使用分割图Ms来引导对应阶段的特征图fs,从而实现分割引导机制;分割图Ms是通过激活函数来计算得到:
Ms=sigmoid(conv(Fs)) (2)
最后在s阶段的高分辨率分支输出的的预测热图ys计算为:
ys=fs⊙Ms (3)。
5.根据权利要求4所述的一种基于分割引导的人体姿态估计方法,其特征在于步骤(3)具体实现如下:
分割图损失函数骨骼点热力图的损失函数通过下方式获得:
其中,N为模型含有的阶段数,Ms表示第s阶段预测的分割图,为分割图真值;
其中,p代表第p个预测位置,(m,n)表示模型输出的热图空间位置,yp表示预测热图,表示热图真值;
在进行多任务优化时,使用动态加权的方式来动态平衡两个任务的损失函数,得到最终的损失函数
其中,t表示第t次反向传播,ws(t)为分割损失函数的动态加权,wk(t)为骨骼点损失函数的动态加权
N1为任务数量,rn(t-1)为任务n的损失函数变化因子,计算方式如下:
针对通过反向传播算法迭代训练,直至模型收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110726048.0/1.html,转载请声明来源钻瓜专利网。