[发明专利]一种针对单一深度图像的3D人体姿态估计算法有效
申请号: | 201711406248.8 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108154176B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 蔡轶珩;王雪艳;孔欣然;马杰;李媛媛 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/50 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于单一深度图像的3D人体姿态估计方法。首先提出改进型特征提取办法,综合利用部位尺寸信息和距离变换信息,来指导深度梯度特征提取,可极大增强所提特征的表达能力;为解决随机森林部位分类时存在的误分类问题,提出误分类处理机制—多级随机森林整合算法来去除部位误分点,获得更为准确的部位识别结果;通过改进PDA,利用位置权重阈值处理办法,使能够利用识别的部位尺寸信息,自适应的再次去除部位中的干扰点,从而获得更为准确的主方向向量;最后利用人体部件配置关系得到姿态估计结果。本发明改善了部位分类模型的准确率,并能有效去除识别部位中的误分类干扰点,提高识别部位的准确性,最终获得更为准确的3D人体姿态估计结果。 | ||
搜索关键词: | 一种 针对 单一 深度 图像 人体 姿态 估计 算法 | ||
【主权项】:
基于单一深度图像的3D人体姿态估计方法,其特征在于,包括以下步骤:(1)、合成图像合成身体部位带标签的深度图像数据库,实验中将图像归一化为225*300;(2)、特征提取2.1)均匀抽取每幅图像的的像素样本;2.2)将深度图像像素值大小按比例归一化到0~1000之间,其中背景设为1000,人体信息在0~1000之间;2.3)计算深度人体像素x位置的特征MGoDθ=(u,v)(x),MGoDθ=(u,v)(x)=dI(x+xu)‑dI(x+xv)θ=(u,v)为单位偏移向量对,xu=u*q和xv=v*q为偏移向量,q为偏移量,x+xu和x+xv为像素点x分别经向量xu和xv偏移后的像素点位置,dI(x+xu)和dI(x+xv)为像素点x分别经偏移向量xu和xv偏移后的像素点的深度值;其中偏移量q,本发明综合考虑了部位尺寸和距离信息因素,通过部位最小矩形方法,分别包含身体各个部位,计算其最小矩形斜边η1(ζ1),作为偏移量q计算的部位尺寸信息,其中q计算公式如下 深度图像I包含m个身体部位,表示第ζ1个身体部位对应的偏移量值,dI(·)表示深度图像I的人体信息中某像素点的深度值,min(dI(·))表示深度人体像素点的深度最小值,η1(ζ1)为第ζ1个身体部位的最小矩形斜边;(3)、分类识别在部位融合基础上,将上述提取到的特征输入到随机森林中训练分类器进行分类识别;训练阶段:训练部位分类模型,其中部位特征提取的偏移量采用所有训练样本各部位的均值;测试阶段:利用部位分类模型分类识别身体部位,其中部位特征提取的偏移量采用所有训练样本偏移量的均值;其中训练图像和测试图像均归一化为225*300;(4)、误分类处理机制上述分类识别时,偏移量的选择在训练阶段和测试阶段之间有所不同,使得在随机森林训练阶段和测试阶段提取的特征的表达信息出现偏差,并且使用随机森林分类模型获得的分类结果与特征提取时偏移量的选择有关,特别是误分类点,因而本发明提出误分类处理机制—多级随机森林整合算法,来降低识别部位中的误分点,具体如下;第一步,以所有训练样本偏移量均值为基础,以等差方法前后选择多个偏移量,分别进行特征提取,随后利用随机森林分类模型分别获得多个部位分类结果;其中每个偏移量对应部位分类识别是独立进行的;第二步,将第一步获得的多种随机森林初步分类结果,对应相同部位的相同分类结果进行两两整合,去除不同分类点,保留相同分类点;(5)、改进的PDA算法利用上述误分类处理机制—多级随机森林整合算法处理随机森林分类结果后,能有效降低识别部位中存在的错误分类点,但也还会在处理后的部位周围残留一些离散点;为此,本发明提出了改进的PDA算法,通过位置权重阈值处理法将这些离散点去除,并最终计算出各身体部位的主方向向量—部位主轴;具体如下:5.1)将(4)处理的部位点云,利用逻辑函数和马氏距离计算每个像素点的位置权重;逻辑函数计算公式如下 其中w(ti)为第i个像素点的位置权重值,C是限定输出值(此时C=1),to=1,α=0.5,ti为第i个像素点的马氏距离;在计算身体部位各像素点的位置权重w(ti)时,像素点的权重值随像素点位置不同而变化;马氏距离计算公式如下 其中为部位点云的均值,为部位点云的协方差,yi为第i个像素点的深度值,T代表向量的转置处理,n为部位点云中像素点的个数;5.2)使用位置权重阈值处理办法,去除干扰点;设定位置权重阈值将识别的身体部位像素点排列组合为最小正方形,取其斜边η2(ζ1)为为此身体部位的尺寸值,以此计算阈值大小;
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711406248.8/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序