[发明专利]多模态3D目标检测方法、系统、终端及介质在审
申请号: | 202110263197.8 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112990229A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 马超 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 刘翠 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多模态 目标 检测 方法 系统 终端 介质 | ||
1.一种多模态3D目标检测方法,其特征在于,包括如下步骤:
分别提取原始图像I和对应的LiDAR点云L的特征;
将所述原始图像I和对应的LiDAR点云L的特征进行点和像素的特征融合,形成LiDAR点云特征,将所述原始图像I的特征作为图像特征,分别生成3D区域提议和2D区域提议;
分别从所述3D区域提议和2D区域提议内提取特征并进行融合,生成最终的3D目标检测结果。
2.根据权利要求1所述的多模态3D目标检测方法,其特征在于,所述分别提取原始图像I和对应的LiDAR点云L的特征,包括:
获取原始图像I、对应的LiDAR点云L、图像特征提取器FEI以及LiDAR点云特征提取器FEL;
将所述原始图像I输入到所述图像特征提取器FEI,得到原始图像I的特征FI;
将所述LiDAR点云L输入到所述LiDAR点云特征提取器FEL,得到LiDAR点云L的特征FL。
3.根据权利要求1所述的多模态3D目标检测方法,其特征在于,所述将所述原始图像I和对应的LiDAR点云L的特征进行点和像素的特征融合,形成LiDAR点云特征,将所述原始图像I的特征作为图像特征,分别生成3D区域提议和2D区域提议,包括:
根据提取得到的所述LiDAR点云L的特征FL,将所述LiDAR点云L分为前景点Lf和背景点Lb,对于所有前景点Lf,以Lf为中心设置3D锚框A3D;
将所述3D锚框A3D投影到图像平面上,得到对应的2D锚框A2D,形成LiDAR坐标系下的点与图像坐标系下的像素之间的投影关系;
根据所述投影关系,得到所述原始图像I的特征FI和所述LiDAR点云L的特征FL之间的对应关系,根据所述对应关系将所述原始图像I的特征FI和所述LiDAR点云L的特征FL进行点和像素的特征融合;
以融合得到的特征作为LiDAR点云特征F′L,对所述3D锚框A3D进行回归和分类任务,并计算回归误差和分类误差得到回归后的3D锚框A′3D;以所述原始图像I的特征FI作为图像特征FI,对所述2D锚框A2D进行回归和分类任务,并计算回归误差和分类误差得到回归后的2D锚框A′2D;
分别取得分最高的前T个2D锚框A′2D和3D锚框A′3D,分别作为2D区域提议Pro2D和3D区域提议Pro3D;
将所述3D锚框A′3D根据所述投影关系投影到图像平面生成2D锚框A″2D,并计算所述2D锚框A″2D与所述2D锚框A′2D的误差Lpro;
构建损失函数其中,α,β,γ分别为各项系数,通过最小化该损失函数更新网络参数,直至网络收敛。
4.根据权利要求3所述的多模态3D目标检测方法,其特征在于,所述3D锚框A3D尺寸为:长3.9米、宽1.6米、高1.5米。
5.根据权利要求3所述的多模态3D目标检测方法,其特征在于,LiDAR坐标系下的点x与图像坐标系下的像素y之间的投影关系为:
其中,f(i),c(i),分别是相机传感器的内参,是0号相机的矫正旋转矩阵,是相机与LiDAR坐标系的旋转向量,是相机与LiDAR坐标系的平移向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110263197.8/1.html,转载请声明来源钻瓜专利网。