[发明专利]一种基于混合特征感知神经网络进行3D目标检测的方法在审
申请号: | 201910919370.8 | 申请日: | 2019-09-26 |
公开(公告)号: | CN110910450A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 魏平;夏春龙;郑冲;郑南宁 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06T7/73 | 分类号: | G06T7/73 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 姚咏华 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 特征 感知 神经网络 进行 目标 检测 方法 | ||
1.一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,包括以下步骤:
步骤1)、获取目标检测物的RGB图和RGB图相对应的深度图;
步骤2)、采用MCG算法对RGB图进行预处理,得到目标检测物的2D候选区;
步骤3)、从RGB图中的目标检测物的2D候选区初始化得到一个目标检测物的3D候选区,根据2D候选区域对应的类别联合与RGB图对应的深度图初始化3D候选区的中心点的位置和目标检测物的尺寸大小;
步骤4)、建立分类任务损失函数和位置比例损失函数的神经网络模型,将初始化3D候选区后的RGB图和RGB图相对应的深度图输入到神经网络模型中,神经网络模型输出结果即为目标检测物的真实位置。
2.根据权利要求1所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,步骤3)中,目标检测物在世界坐标系中的坐标为其中,[xcam,ycam,zcam]是目标检测物在相机坐标系下的中心,[l,w,h]是目标检测物在倾斜坐标系下的3D尺寸,是目标检测物在倾斜坐标系中方向向量与z轴的夹角;倾斜坐标系是通过将相机坐标系中点云的方向与重力方向一致转换得来的,倾斜坐标系没有对相机坐标系做任何的y轴旋转。
3.根据权利要求2所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,相机坐标系与倾斜坐标系之间的转换关系如公式(1)所示,倾斜坐标系与世界坐标系之间的转换矩阵由公式(2)得到:
XYZtilt=Rtilt*XYZcam (1)
Rtilt=Rx*Rz (2)
其中,Rtilt是倾斜坐标系与世界坐标系之间的转换矩阵,Rx和Rz分别是x轴和z轴的旋转矩阵。
4.根据权利要求1所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,根据2D候选区域对应的类别联合与RGB图对应的深度图初始化3D候选区域的中心点的位置和尺寸大小,对于每一个3D的候选区域的尺寸大小,通过与尺寸大小相对应类别的平均尺寸初始化。
5.根据权利要求4所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,对于目标检测物在3D候选区的中心点位置进行初始化得到初始化坐标(xinit,yinit,zinit),其中zinit通过zmed初始化得到,xinit和yinit通过公式(3)计算得到;对于3D候选区域,初始化为0;
其中,zmed对应的是2D候选区映射到3D候选区的中值深度;f是获取RGB图相机的焦距,(cx,cy)是2D候选区的中心坐标,(ox,oy)是获取RGB图相机的中心点坐标。
6.根据权利要求1所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,步骤4)中,将RGB图输入神经网络模型理前,通过卷积和池化对输入的RGB图进行降维和特征预处理。
7.根据权利要求1所述的一种基于混合特征感知神经网络进行3D目标检测的方法,其特征在于,利用混合感知模块对降维和特征预处理后的RGB图提取特征,其中混合感知模块是一个相同尺度大小的多层特征感知器;每一层特征感知器都是卷积、池化和激活函数的一个组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910919370.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种内部威胁检测方法及装置
- 下一篇:一种变径筒体加工装置及其加工方法