[发明专利]三维目标检测方法及其模型的训练方法及相关装置、设备在审
申请号: | 201911379639.4 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111179247A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 董乐;张宁;陈相蕾;赵磊;黄宁;赵亮;袁璟 | 申请(专利权)人: | 上海商汤智能科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/73 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三维 目标 检测 方法 及其 模型 训练 相关 装置 设备 | ||
1.一种三维目标检测模型的训练方法,其特征在于,包括:
获取样本三维图像,其中,所述样本三维图像标注有三维目标的实际区域的实际位置信息;
利用三维目标检测模型对所述样本三维图像进行目标检测,得到与所述样本三维图像的一个或多个子图像对应的一个或多个预测区域信息,其中,每个所述预测区域信息包括预测区域的预测位置信息和预测置信度;
利用所述实际位置信息与所述一个或多个所述预测区域信息,确定所述三维目标检测模型的损失值;
利用所述损失值,调整所述三维目标检测模型的参数。
2.根据权利要求1所述的训练方法,其特征在于,所述预测区域信息的数量为预设数量个,所述预设数量与所述三维目标检测模型的输出尺寸相匹配;
所述利用所述实际位置信息与所述一个或多个所述预测区域信息,确定所述三维目标检测模型的损失值,包括:
利用所述实际位置信息,生成分别与所述预设数量个子图像对应的预设数量个实际区域信息,其中,每个所述实际区域信息包括所述实际位置信息和实际置信度,所述实际区域的预设点所在的子图像对应的实际置信度为第一值,其余所述子图像对应的实际置信度为小于所述第一值的第二值;
利用与所述预设数量个子图像中对应的所述实际位置信息和所述预测位置信息,得到位置损失值;
利用与所述预设数量个子图像中对应的所述实际置信度和所述预测置信度,得到置信度损失值;
基于所述位置损失值和所述置信度损失值,得到所述三维目标检测模型的损失值。
3.根据权利要求2所述的训练方法,其特征在于,所述实际位置信息包括所述实际区域的实际预设点位置和实际区域尺寸,所述预测位置信息包括所述预测区域的预测预设点位置和预测区域尺寸;
所述利用与所述预设数量个子图像中对应的所述实际位置信息和所述预测位置信息,得到位置损失值,包括:
利用二分类交叉熵函数,对与所述预设数量个子图像中对应的所述实际预设点位置和所述预测预设点位置进行计算,得到第一位置损失值;
利用均方误差函数,对与所述预设数量个子图像中对应的所述实际区域尺寸和所述预测区域尺寸进行计算,得到第二位置损失值;
所述利用与所述预设数量个子图像中对应的所述实际置信度和所述预测置信度,得到置信度损失值,包括:
利用二分类交叉熵函数,对与所述预设数量个子图像中对应的所述实际置信度和所述预测置信度进行计算,得到置信度损失值;
所述基于所述位置损失值和所述置信度损失值,得到所述三维目标检测模型的损失值,包括:
对所述第一位置损失值、所述第二位置损失值和所述置信损失值进行加权处理,得到所述三维目标检测模型的损失值。
4.根据权利要求1-3中任意一项所述的训练方法,其特征在于,在所述利用所述实际位置信息与所述一个或多个所述预测区域信息,确定所述三维目标检测模型的损失值之前,所述方法还包括:
将所述实际位置信息的值、所述一个或多个所述预测位置信息和所述预测置信度均约束至预设数值范围内;
所述利用所述实际位置信息与所述一个或多个所述预测区域信息,确定所述三维目标检测模型的损失值,包括:
所述利用经约束后的所述实际位置信息与所述一个或多个所述预测区域信息,确定所述三维目标检测模型的损失值。
5.根据权利要求4所述的训练方法,其特征在于,所述实际位置信息包括所述实际区域的实际预设点位置和实际区域尺寸,所述预测位置信息包括所述预测区域的预测预设点位置和预测区域尺寸;
所述将所述实际位置信息的值约束至预设数值范围内,包括:
获得所述实际区域尺寸与预设尺寸之间的第一比值,并将所述第一比值的对数值作为经约束后的实际区域尺寸;
获得所述实际预设点位置与所述子图像的图像尺寸之间的第二比值,将所述第二比值的小数部分作为经约束后所述实际预设点位置;
所述将所述一个或多个所述预测位置信息和所述预测置信度均约束至预设数值范围内,包括:
利用预设映射函数分别将所述一个或多个预测预设点位置和预测置信度映射到所述预设数值范围内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤智能科技有限公司,未经上海商汤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911379639.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:纸张轮廓的歪斜纠偏方法
- 下一篇:一种动态多级缓存的方法和设备