[发明专利]一种基于深度学习的单目图像3D物体检测方法有效
申请号: | 202110519164.5 | 申请日: | 2021-05-12 |
公开(公告)号: | CN113221744B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 雷建军;郭亭佚;彭勃;于传波;刘秉正;王梦园 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V20/64 | 分类号: | G06V20/64;G06V10/40;G06V10/764;G06V10/774 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图像 物体 检测 方法 | ||
1.一种基于深度学习的单目图像3D物体检测方法,其特征在于,所述方法包括:
基于彩色图特征和深度图特征提取网络,分别学习彩色图和深度图的三维特征表示;
将学习的彩色图和深度图的三维特征分别送入图像流和深度流检测头中,以联合预测所有先验框的分类得分以及正先验框相比于匹配真实框的回归偏移量;
针对每个正先验框,图像流检测头输出相比于匹配真实框的旋转角偏移量、中心深度偏移量,深度流检测头输出另一组旋转角偏移量和中心深度偏移量;针对同一正先验框的两种不同预测结果,使用平滑L1损失函数来分别计算旋转角和中心深度的一致性损失;
定义旋转角置信度表示该预测框的输出旋转角的准确度,在图像流检测头增加旋转角置信度预测分支以直接输出该预测框的旋转角置信度;
构建网络优化的联合检测损失函数。
2.根据权利要求1所述的一种基于深度学习的单目图像3D物体检测方法,其特征在于,所述方法还包括:
在测试阶段,利用旋转角置信度对分类置信度进行加权,得到综合考虑二维定位信息和方向信息的联合置信度,用于非极大值抑制算法中置信度的排序。
3.根据权利要求1所述的一种基于深度学习的单目图像3D物体检测方法,其特征在于,所述方法还包括设计能够表征旋转角准确度的动态标签对旋转角置信度预测分支进行约束。
4.根据权利要求3所述的一种基于深度学习的单目图像3D物体检测方法,其特征在于,在计算动态标签时引入余弦函数来预测旋转角αi和真实旋转角αgt所反映的预测框和真实框的方向差异。
5.根据权利要求3或4所述的一种基于深度学习的单目图像3D物体检测方法,其特征在于,所述方法还包括:将动态标签作为旋转角置信度预测分支的回归目标。
6.根据权利要求1所述的一种基于深度学习的单目图像3D物体检测方法,其特征在于,所述构建网络优化的联合检测损失函数包括:
对图像流和深度流预测的成对旋转角和成对中心深度,使用一致性损失来联合训练两种预测分支。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110519164.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序