[发明专利]一种针对单一深度图像的3D人体姿态估计算法有效
申请号: | 201711406248.8 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108154176B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 蔡轶珩;王雪艳;孔欣然;马杰;李媛媛 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/50 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 单一 深度 图像 人体 姿态 估计 算法 | ||
本发明公开一种基于单一深度图像的3D人体姿态估计方法。首先提出改进型特征提取办法,综合利用部位尺寸信息和距离变换信息,来指导深度梯度特征提取,可极大增强所提特征的表达能力;为解决随机森林部位分类时存在的误分类问题,提出误分类处理机制—多级随机森林整合算法来去除部位误分点,获得更为准确的部位识别结果;通过改进PDA,利用位置权重阈值处理办法,使能够利用识别的部位尺寸信息,自适应的再次去除部位中的干扰点,从而获得更为准确的主方向向量;最后利用人体部件配置关系得到姿态估计结果。本发明改善了部位分类模型的准确率,并能有效去除识别部位中的误分类干扰点,提高识别部位的准确性,最终获得更为准确的3D人体姿态估计结果。
技术领域
本发明涉及计算机视觉领域,尤其是一种针对单一深度图像的3D人体姿态估计算法。
背景技术
基于图像的人体姿态估计是计算机视觉领域的一个重要研究热点,其中以此为基础的人体运动,行为分析等已被广泛应用于视频监控、行为分析和人机交互等领域。人体姿态估计是一个能通过估计算法,从视频或图像中自动定位各关节位置,并根据人体部位配置关系,估计出人体姿态的过程。但是在实际环境中,由于人体结构和运动姿态的复杂性问题,同时不同人体的体型,着装,肤色等也均有差异,这些都对准确预测姿态的质量造成挑战。而深度图像中像素记录的是距离信息,具有颜色无关性,基本可避免彩色图像在肤色、光照等方面遇到的问题。
到目前为止,基于此任务的人体姿态估计方法已有许多研究算法被提出,主要可分为两类:基于模型的方法和基于非模型的方法。对于前者,是利用人体先验知识构建人体模型,将模型和图像中的人体轮廓、梯度等特征对应,求解模型参数,此方法基本可覆盖人体部位所有可能的姿态,但同时也受复杂模型的限制,由于很难构建出具有强代表性的人体模型,不利于实际推广应用。基于无模型的人体姿态估计方法是以学习的方式来构建人体特征与人体姿态之间的复杂映射关系,此方法不需要构建复杂的人体模型,既可不受模型的约束,但此方法为适用于现实情况,需要建立庞大的数据库。
无模型人体姿态估计与有模型人体姿态估计相比,不需要利用特征信息建立人体数学模型,可大大降低计算复杂性,其中算法基本可分为建立姿态数据库,特征提取,训练分类模型和姿态估计四部分,其中最重要的是特征提取,分类器的训练和姿态估计三方面。特征提取阶段可利用人体部件尺度特征,深度梯度差分特征等方法;分类阶段可利用随机森林分类和回归模型;姿态估计阶段有Mean-shift估计关节位置和主方向分析算法(PDA)估计部位主方向向量等方法。但基于随机森林完成3D人体姿态估计算法中还存在一定的局限性。由于部位分类器准确率的限制,使得分类器存在误分类现象,特别是使用随机森林对像素进行分类任务中,识别的身体部位中存在许多误分类点,这些误分类点容易对后续的关节点定位造成一定的影响,从而降低姿态估计的准确度。若能进一步提高随机森林分类准确率,并尽可能的去除误分类点,降低误分点对后续算法的影响,并提高部位主方向向量的质量,则会大大改善姿态估计的性能。
发明内容
本发明的目的是提供一种3D人体姿态估计方法。我们首先通过特征提取阶段的改进算法,改善特征的表达性能,来提高部位分类准确率,为降低识别的部位中误分点对后续姿态估计算法的影响,本发明提出误分类处理机制和位置权重阈值处理办法,在随机森林初步部位分类结果后处理,可极大降低部位识别结果的误分点,改善了部位主方向向量结果--主轴,从而获得更准确的姿态估计结果。
本发明采用如下技术方案:
1.考虑到现有深度图像数据库,缺乏我们所需的基于像素部位的标签,不适用于本实验,为此我们通过合成深度图像数据库,来解决训练过程所需大量数据的问题,实验中将深度图像归一化为225*300。
2.深度图像像素记录的是距离信息,我们利用像素与其周围像素点之间的差即深度梯度差分特征作为我们的特征提取思想。首先利用背景减除法,将图像背景去除,只留下人体深度信息,随后进行特征提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711406248.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序