[发明专利]多模态自适应融合的三维目标检测方法在审

专利信息
申请号: 201910837423.1 申请日: 2019-09-05
公开(公告)号: CN110543858A 公开(公告)日: 2019-12-06
发明(设计)人: 袁媛;王琦;刘程堪 申请(专利权)人: 西北工业大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32;G06K9/62
代理公司: 61204 西北工业大学专利中心 代理人: 王鲜凯<国际申请>=<国际公布>=<进入
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种多模态自适应融合的三维目标检测方法,用于解决现有三维目标检测方法检测效率低的技术问题。技术方案是输入RGB图像以及BEV Map,首先使用FPN网络结构,包含编码器和解码器结构,得到二者全分辨率的特征图,用于结合底层细节信息和高层语义信息,然后通过特征裁剪提取两个特征图对应的特征进行裁剪并自适应融合,最后挑选出3D建议以实现3D物体检测。整个过程是两阶段检测,此外使用RGB图像和点云作为原始输入,减少了LIDAR FV输入,降低了计算量,减少算法的计算复杂度,提高了三维空间车辆目标检测的效率。这种算法有效提高了对小物体的检测效果以及被遮挡车辆以及被截断车辆的检测率。
搜索关键词: 检测 三维目标 特征图 自适应 算法 裁剪 三维空间 高层语义信息 计算复杂度 解码器结构 两阶段检测 车辆目标 全分辨率 网络结构 细节信息 编码器 多模态 计算量 检测率 小物体 融合 截断 点云 遮挡
【主权项】:
1.一种多模态自适应融合的三维目标检测方法,其特征在于包括以下步骤:/n步骤一、利用特征提取器从鸟瞰图和图像中生成特征图,将LIDAR点云投射到鸟瞰图,从一个分辨率为0.1m的点云的体素网格中生成六通道鸟瞰图;将点云裁剪在[-40,40]×[0,70]范围内,从而包含相机视野内的点;鸟瞰图的前五个通道是每个栅格单元的最大高度,是由Z轴上[0,2.5]米范围内五个相同的切片生成;第六个通道信息包含的是每个单元中的密度信息,由确定,其中N是体素网格中的点数;/n步骤二、使用图像输入和LIDAR输入两个特征提取器,将VGG-16网络通道数减半,并在第四层卷积层裁剪网络;编码器将一个M*N*D的图像或者鸟瞰图作为输入,并输出(M/8)×(M/8)×D的特征图;设计一个自底向上的解码器将编码器输出的特征图上采样恢复至原始输入尺寸;通过解卷积将两个编码器输出的相关联的特征图级联,然后通过一个3×3卷积将两者融合;/n步骤三、由形心(tx,ty,tz)和轴对齐尺寸(dx,dy,dz)编码生成锚盒,通过积分图像将空锚有效去除,最终每一帧产生80-100k个非空锚;给定一个锚,将其分别投影到鸟瞰图和图像中获得两个感兴趣区域;然后用这两个相关的感兴趣区域从每个视图中提取特征修剪区域;将提取出的特征修剪区域双线性地调整至3×3,获得两个相同长度的特征向量,使用1×1卷积进行降维并生成3D建议;/n步骤四、利用四个顶点和两个高度信息进行3D最小包围框的约束进行编码,将来自两个输入视图裁剪调整为7×7,然后与元素方式均值操作进行融合;一组三个完全连接的大小为2048的层来处理融合特征图,以输出每个提案的框回归,方向估计和类别分类。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910837423.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top