[发明专利]一种人体图像关键点姿态估计方法在审
申请号: | 201910614512.X | 申请日: | 2019-07-09 |
公开(公告)号: | CN110443144A | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 侯峦轩;马鑫;孙哲南;赫然 | 申请(专利权)人: | 天津中科智能识别产业技术研究院有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 300457 天津市滨海新区天津经济技*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种人体图像关键点姿态估计方法。包括步骤:对输入的训练图像预处理,用基于特征金字塔网络的行人检测网络对输入图像进行检测;将检测到的人体形成的边界框进行裁剪,只保留框内图像;将裁剪后图像输入到设计的模型中,进行人体姿态关键点估计。本发明可以将含有人体的输入图像进行关键点生成,并且生成估计处理后的图像中生成的人体关键点具有较高精度,较好保持了人体的骨架几何信息。 | ||
搜索关键词: | 关键点 人体图像 输入图像 姿态估计 裁剪 预处理 图像 金字塔网络 几何信息 人体姿态 图像输入 行人检测 训练图像 边界框 检测 保留 网络 | ||
【主权项】:
1.一种人体图像关键点姿态估计方法,其特征在于,包括以下步骤:步骤S1.将图像数据库中的图像数据预处理:首先,将原始图像送入已经训练好的特征金字塔网络FPN检测,只输出人体用边界框标记的人体图像;然后将输出的人体图像裁剪,形成预定格式大小,然后进行增强处理;步骤S2.通过训练得到能够对人体图像进行姿态估计以得到人体固件关键点图像的深度神经网络模型:利用步骤S1中已裁剪完的人体图像作为网络的输入,以训练集中的用xy轴坐标形式标出的json文件作为人体关键点标注信息像作为GroundTruth,训练深度神经网络模型中的全局网络和矫正网络,获得训练好的完成从人体图像到人体关键点图像的姿态估计的深度神经网络模型;其中,通过全局网络的ResNet50网络对输入的人体图像处理,得到不同尺寸的特征图输出,采用自底向上的U‑Shape结构,将每一层特征图进行自底向上做采样后进行加和后,进行预测操作,其中,用与GroudTruth进行L2损失函数计算以进行损失约束;通过预测操作进行预定卷积步骤处理后,生成不同关键点的热力图,从而得到初始人体关键点;将全局网络中每一层加和的特征图,通过Dilated Bottleneck后分别进行上采样,然后进行concat操作后通过Bottleneck,并采用L2损失约束,随后通过卷积进行热力图生成,修正初始的人体关键点,得到最终的人体关键点;模型迭代多次达到稳定后,完成模型的训练;步骤S3.使用训练好的深度神经网络模型,对测试数据集中的包含人体的图像进行姿态估计处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津中科智能识别产业技术研究院有限公司,未经天津中科智能识别产业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910614512.X/,转载请声明来源钻瓜专利网。