[发明专利]一种基于四类多模态数据融合的目标多维度检测方法在审
申请号: | 202111255921.9 | 申请日: | 2021-10-27 |
公开(公告)号: | CN113971801A | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 吕昊;方铭宇;宋治儒;钱伟行;刘童;亓霈;孟佳杰;汪澜泽;马玉浩 | 申请(专利权)人: | 南京师范大学;江苏省中以产业技术研究院 |
主分类号: | G06V20/64 | 分类号: | G06V20/64;G06V10/40;G06V10/762;G06V10/774;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 210024 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 四类多模态 数据 融合 目标 多维 检测 方法 | ||
本发明公开了一种基于四类多模态数据融合的目标多维度检测方法,包括:采集待检测目标的雷达点云图像、红外图像、磁场图像以及RGB图像,搭建卷积神经网络对四种输入图像进行特征提取,将预定义三维锚框投影到四种特征图上,搭建引入注意力模块的RPN网络生成建议框,将建议框投影到四种特征图上,搭建全连接网络实现边界框回归、方向估计和类别分类。本发明针对采用通常的RGB图像目标检测方法的缺陷,利用雷达、红外以及磁场图像可以弥补信息的缺失,提高对目标的检测精度。
技术领域
本发明涉及深度学习、图像识别、三维目标检测技术领域,特别涉及了一种基于四类多模态数据融合的目标多维度检测方法。
背景技术
在机器人、自动装载和自动驾驶等许多实际应用中,物体的三维位置信息越来越受到重视,三维目标检测是建立机器与环境交互机制的关键技术。
目前基于雷达点云的三维目标检测方法主要包括两种,一种是对点云进行体素化,如VoxelNet;另一种是将点云投射到二维平面,如PIXOR。以图像为辅助融合处理雷达点云的方法主要包括:使用点云的俯视图和前视图与图像融合的MV3D,使用点云的俯视图与图像融合的AVOD等。检测小目标和遮挡目标仍然是当前最具有挑战性的,并且对于物体内部目标的检测目前研究较少,融合其他数据源信息的三维目标检测也较少。
发明内容
本发明所要解决的技术问题是为了解决上述背景技术提出的技术问题,本发明旨在提供一种基于四类多模态数据融合的目标多维度检测方法,融合多种数据源的图像信息,将注意力网络集成到多模态三维物体检测器中,解决物体遮挡、物体内部目标检测困难的问题。
为了实现上述技术目的,本发明提出一种基于四类多模态数据融合的目标多维度检测方法,包括:
步骤1、采集待检测目标的雷达、红外、磁场以及彩色图像,将其划分为训练集、验证集和测试集,并且进行三维锚框标注,生成数据集;
步骤2、搭建四个结构独立的卷积神经网络作为主干网络,用于提取四种输入图像的特征图,同时采用GAU模块增强特征的信息;
步骤3、在训练集上通过聚类预先设置三维锚框,投影到四种特征图上,裁剪并池化到相同大小进行融合,搭建RPN网络生成建议框,同时引入注意力模块;
步骤4、将RPN网络生成的建议框投影到四种特征图上,裁剪并池化到相同大小进行融合,搭建全连接网络,生成最终的预测框,同时引入注意力模块。
进一步,本发明提出的多维度检测方法,步骤1包括:
步骤1.1、将雷达、红外传感器、磁传感器以及摄像头集成到一起,确保四种图像对齐,采集较多的四种类型的目标图像,去除其中不清晰的图像,其中雷达点云数据转换成BEV鸟瞰图;
步骤1.2、将获得的数据集按一定比例划分为训练集、验证集和测试集,对训练集和验证集进行三维锚框标注,测试集用于评估目标检测网络训练的效果。
进一步,本发明提出的多维度检测方法,步骤2中,是通过四个结构独立的卷积神经网络分别对四种输入图像进行特征提取,主干网络采用VGG16结构,在conv-4处截断,每个卷积层滤波器数量变为原来的一半,最终提取四个256通道的特征图,同时采用GAU模块增强特征图的信息。
进一步,本发明所提出的多维度检测方法,步骤3包括:
步骤3.1、在训练集上采用聚类算法为每个类别生成大量的预定义锚框,并将其投影到主干网络的四种输出特征图上,裁剪对应的部分并且通过池化操作调整为相同宽高的特征图;
步骤3.2、对于每个锚框,通过元素平均操作将四种特征图进行融合,然后将其输入全连接网络,最终输出锚框的回归参数以及为前景的分数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京师范大学;江苏省中以产业技术研究院,未经南京师范大学;江苏省中以产业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111255921.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置