[发明专利]三维关键点预测及深度学习模型训练方法、装置及设备在审
申请号: | 201911417835.6 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111160375A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 刘思阳 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 李欣;丁芸 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三维 关键 预测 深度 学习 模型 训练 方法 装置 设备 | ||
1.一种三维关键点预测方法,其特征在于,所述方法包括:
获取包含待检测对象的RGB图像;
基于所述RGB图像,获取所述待检测对象的二维关键点信息及每个二维关键点对应的热度图像;
利用预先训练的深度学习模型,对所述RGB图像、所述二维关键点信息及所述热度图像进行关联分析,得到所述待检测对象的三维关键点信息的预测值。
2.根据权利要求1所述的方法,其特征在于,所述利用预先训练的深度学习模型,对所述RGB图像、所述二维关键点信息及所述热度图像进行关联分析,得到所述待检测对象的三维关键点信息的预测值,包括:
利用所述深度学习模型,对所述RGB图像的矩阵及所述热度图像的矩阵进行拼接,得到目标拼接矩阵;
对所述目标拼接矩阵进行特征提取,得到初始图像特征;
对所述初始图像特征进行维度变换,得到目标图像特征;
对所述二维关键点信息进行分析,得到目标关键点特征;
对所述目标图像特征及所述目标关键点特征进行关联分析,得到所述待检测对象的三维关键点信息的预测值。
3.一种深度学习模型训练方法,其特征在于,所述方法包括:
获取待训练的深度学习模型;
在预设样本集合中选取一组样本图像组,其中,所述样本图像组包括样本RGB图像、样本二维关键点信息、每个样本二维关键点对应的样本热度图像及真值三维关键点信息,所述样本二维关键点信息通过对所述样本RGB图像进行二维关键点检测得到;
利用所述深度学习模型,对当前选取的样本RGB图像、样本热度图像及样本二维关键点信息进行关联分析,得到预测三维关键点信息;
根据所述真值三维关键点信息及所述预设三维关键点信息,计算所述深度学习模型的当前损失;
在所述深度学习模型的当前损失未收敛时,按照所述当前损失,调整所述深度学习模型的参数,并在所述预设样本集合中选取一组样本图像组继续训练,直至所述深度学习模型的损失收敛,得到训练好的深度学习模型。
4.根据权利要求3所述的方法,其特征在于,所述利用所述深度学习模型,对当前选取的样本RGB图像、样本热度图像及样本二维关键点信息进行关联分析,得到预设三维关键点信息,包括:
利用所述深度学习模型,对当前选取的样本RGB图像的矩阵及所述样本热度图像的矩阵进行拼接,得到样本拼接矩阵;
对所述样本拼接矩阵进行特征提取,得到初始样本图像特征;
对所述初始样本图像特征进行维度变换,得到目标样本图像特征;
对所述样本二维关键点信息进行分析,得到目标样本关键点特征;
利用所述深度学习模型,将所述目标样本图像特征及所述目标样本关键点特征进行拼接,得到目标样本拼接特征;
对所述目标样本拼接特征进行分析,得到预测三维关键点信息。
5.根据权利要求3所述的方法,其特征在于,所述根据所述真值三维关键点信息及所述预设三维关键点信息,计算所述深度学习模型的当前损失,包括:
对所述预测三维关键点信息进行投影,得到预测二维关键点信息;
基于所述样本二维关键点信息及所述预测二维关键点信息,计算二维关键点损失;
基于所述真值三维关键点信息及所述预测三维关键点信息,计算三维关键点损失;
基于所述二维关键点损失及所述三维关键点损失,计算所述深度学习模型的当前损失。
6.根据权利要求5所述的方法,其特征在于,所述基于所述二维关键点损失及所述三维关键点损失,计算所述深度学习模型的当前损失,包括:
利用预设二维关键点权重乘以所述二维关键点损失,利用预设三维关键点权重乘以所述三维关键点损失,并对得到的乘积求和,得到所述深度学习模型的当前损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911417835.6/1.html,转载请声明来源钻瓜专利网。