[发明专利]基于卷积神经网络的人体姿态估计方法有效
申请号: | 202111284500.9 | 申请日: | 2021-11-01 |
公开(公告)号: | CN113920587B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 赵蓝飞;陈志铧 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06N3/04;G06N3/08 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 张换男 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 人体 姿态 估计 方法 | ||
基于卷积神经网络的人体姿态估计方法,它属于人体姿态估计技术领域。本发明解决了采用现有方法对人体姿态进行估计时,获得的估计结果不准确的问题。本发明首先设计一种全局卷积算法来增加CNN感受野、提取全局信息;然后利用构建的全局残差块替换残差网络中的残差块得到全局残差子网络,进而提高人体关键点的定位精度;最后,本发明设计了具备修复量化误差能力的量化误差优化子网络,以得到更高精度的关键点定位结果;进而获得了准确的人体姿态估计结果。本发明可以应用于对人体姿态进行估计。
技术领域
本发明属于人体姿态估计技术领域,具体涉及一种基于卷积神经网络的人体姿态估计方法。
背景技术
人体姿态估计(也叫人体关键点检测)是计算机视觉领域的热门研究方向之一,在各种实际场景中都具有很强的应用价值。人体姿态估计的目的是通过算法定位出人体关键点在输入图像中的位置,准确的位置信息是后续研究的基础。随着卷积神经网络(Convolutional Neural Network,CNN)的出现,人体姿态估计算法的定位精度不断提升,目前主流的高性能人体姿态估计模型都是基于CNN来实现的。
CNN通过卷积操作来获得强大的表征学习能力,但是一个卷积滤波器只能关注到局部的信息,全局信息对于人体关键点的准确定位是很重要的,特别是当人体遮挡严重的时候。为了能够包含全局信息,通常的做法是叠加多层CNN。但是当叠加到一定层数后,会出现网络退化的问题。虽然残差网络能够解决网络退化的问题,但是由于跳跃连接的存在使得深层的网络层贡献很小,导致有效的网络路径比预期的要短,因此残差网络很难得到全局视野。
目前主流的人体姿态估计算法还面临一个量化误差的问题。为了降低模型的计算量,常规的基于热图回归的人体姿态估计模型输出热图的分辨率比输入图像要小,网络输出热力图的高和宽都为输入图像的1/4。获得输出热力图之后进行上采样操作将其恢复至原图像大小,然后取热力图最大值所在位置作为关键点的预测位置。这种下采样后再上采样的方法不可避免地会引入量化误差。
综上所述,由于现有的人体姿态估计方法无法提取到全局信息,并存在量化误差,因此,利用现有方法对人体姿态估计的效果欠佳、对人体姿态估计的结果并不准确。
发明内容
本发明的目的是为解决采用现有方法对人体姿态进行估计时,获得的估计结果不准确的问题,而提出了一种基于卷积神经网络的人体姿态估计方法。
本发明为解决上述技术问题所采取的技术方案是:
一种基于卷积神经网络的人体姿态估计方法,所述方法具体包括以下步骤:
步骤一、构建人体姿态估计网络;
所述人体姿态估计网络包括全局残差子网络和量化误差优化子网络;
步骤二、将输入图像输入到全局残差子网络进行全局卷积,得到初步的人体关键点热力图;
步骤三、将步骤二中输出的人体关键点热力图输入到量化误差优化子网络,再通过量化误差优化子网络输出最终的人体关键点热力图;
步骤四、取步骤三输出的人体关键点热力图中的最大值位置坐标作为最终的关键点定位结果;
根据最终的关键点定位结果进行人体姿态估计。
进一步地,所述全局残差子网络从输入端开始,所包括的各部分依次为:第一卷积层、第二卷积层、串联的16个全局残差块、上采样层和第三卷积层。
进一步地,所述全局残差块由三个支路组成,全局残差块的输入特征分别输入三个支路中;
在第一个支路内,依次对输入特征进行1×1卷积、3×3卷积和1×1卷积后,获得第一个支路的输出;
在第二个支路内,不对输入特征进行处理,即直接将其作为第二个支路的输出;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111284500.9/2.html,转载请声明来源钻瓜专利网。