[发明专利]获取空间定位的三维人体姿态估计方法及计算机可读存储介质在审
申请号: | 202110121062.8 | 申请日: | 2021-01-28 |
公开(公告)号: | CN112837362A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 王好谦;高艺华;杨芳 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06T7/70 | 分类号: | G06T7/70;G06N3/08 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 孟学英 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 空间 定位 三维 人体 姿态 估计 方法 计算机 可读 存储 介质 | ||
1.一种获取空间定位的三维人体姿态估计方法,其特征在于,包括如下步骤:
S1:采用人体检测网络从原始图像中获取单人图像并做标准化处理;
S2:使用二维人体姿态估计的方法从所述单人图像中预测关键点的二维坐标,使用三维姿态生成器从所述关键点的二维坐标预测所述关键点的三维坐标,得到三维人体姿态估计的结果;同时从二维人体姿态估计网络的特征中获取人体参数;
S3:根据所述人体参数校正所述三维人体姿态估计的结果的尺度;
S4:计算视角偏差,旋转校正后的三维人体姿态估计结果与相机坐标系对齐;
S5:依据透视投影的原理,拟合绝对深度,获取空间定位,完成三维人体姿态估计。
2.如权利要求1所述的获取空间定位的三维人体姿态估计方法,其特征在于,所述原始图像是单人或多人图像;从所述原始图像中检测每一个人体范围得到所述单人图像;
所述标准化处理包括将所述每一个人体范围内的像素填充到统一比例,放缩到统一尺寸;
所述像素对应的二维关键点的坐标位置标签随所述像素进行所述标准化处理;所述像素对应的三维关键点的坐标位置标签去中心化处理。
3.如权利要求2所述的获取空间定位的三维人体姿态估计方法,其特征在于,使用二维人体姿态估计的方法从所述单人图像中预测关键点的二维坐标,使用三维姿态生成器从所述关键点的二维坐标预测所述关键点的三维坐标包括:
将二维姿态估计网络应用于所述单人图像I,得到的结果为所述单人图像的每个关节点的二维坐标预测值R,描述为:
R=NetA1(I)
通过所述三维姿态生成器从所述关键点的二维坐标预测所述关键点的三维坐标,得到三维人体姿态估计的结果P,表示为:
P=NetA2(R)
其中,NetA1是二维姿态估计网络;NetA2是三维姿态生成器。
4.如权利要求3所述的获取空间定位的三维人体姿态估计方法,其特征在于,从所述二维人体姿态估计网络的特征中获取人体参数包括:
采用网络NetB从二维姿态估计网络NetA1的特征中学习身体参数,表示为:
β=NetB(FA1)
其中,β是一个范围在0.5~1的数值,表征动作信息,F表示网络中间层的特征值。
5.如权利要求4所述的获取空间定位的三维人体姿态估计方法,其特征在于,根据所述人体参数校正所述三维人体姿态估计的结果的尺度得到尺度校正后的三维人体姿态估计P1:
P1=βP。
6.如权利要求5所述的获取空间定位的三维人体姿态估计方法,其特征在于,计算视角偏差,旋转校正后的三维人体姿态估计结果与相机坐标系对齐包括:
根据所述单人图像的中点横、纵坐标获取绕x轴方向和y轴方向的的旋转角度分别为:
将尺度校正后的三维姿态估计P1逆向旋转α角度得到视角校正后的三维姿态估计P2:
P2=Rotateα(P1)
其中,Rotate是将校正后的三维姿态P1进行旋转操作;x、y分别是单人图像的人体检测框的中点横、纵坐标;f为原始图像的成像系统的焦距,c为原始图像的成像平面的传感器尺寸与所述原始图像的像素值之间转换的比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110121062.8/1.html,转载请声明来源钻瓜专利网。