[发明专利]一种基于可学习编码的3D目标检测方法及系统在审
申请号: | 201910785652.3 | 申请日: | 2019-08-23 |
公开(公告)号: | CN111027581A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 王晓莉;熊鹏涛;蒋伟;陈分雄;韩荣;叶佳慧;王杰 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 万文广 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 学习 编码 目标 检测 方法 系统 | ||
1.一种基于可学习编码的3D目标检测方法,包括以下步骤:
S1、构建3D目标检测网络;
S2、获取点云数据,并对其进行切割处理,处理后的数据将一部分作为训练数据,另一部分作为待检测数据;其中,将训练数据输入到步骤S1建立的3D目标检测网络对其进行网络训练;
S3、将待检测数据输入到步骤S2训练好的网络,在该网络中,经过特征提取、特征分类和坐标回归后,进一步实现基于点云数据的3D目标检测。
2.根据权利要求1所述的3D目标检测方法,其特征在于,步骤S2中对通过对点云数据进行切割,得到若干个尺寸相同的3D体素网格,实现对输入数据的预处理操作;其中,基于三维空间,在X轴、Y轴和Z轴上分别使用0.2米,0.2米,0.4米的分辨率,对点云数据进行切割后,得到若干个体素网格。
3.根据权利要求2所述的3D目标检测方法,其特征在于,步骤S1中构建的3D目标检测网络包括特征编码网络、3D卷积神经网络、3D RPN网络、特征提取网络和特征分类网络;其中:
所述特征编码网络,用于针对体素网格中包含的点云数据集合,基于雷达特征编码算法,对点云数据集合进行处理,进一步将点云数据转变为3D数据;其中,编码处理后的数据将进一步输入到3D卷积神经网络,由其进行特征提取;所述3D卷积神经网络输出的特征数据将进一步作为3D RPN网络的输入,通过所述3D RPN网络进一步生成3D候选区域;
生成的3D候选区域输入到特征提取网络中,在该网络中采用反卷积操作,将低层特征与顶层特征进行融合,其中,融合后的特征提取数据将进一步输入到特征分类网络,在该网络中,计算并输出每个候选区域所属的类别概率,得到3D目标检测结果。
4.根据权利要求3所述的3D目标检测方法,其特征在于,所述特征编码网络中,采用2层LFE编码层对点云数据进行编码,其中,在2层LFE编码层之后使用一个最大池化层,将每个体素网格的特征表示为128维的向量,进一步将输入的点云数据转变为3D数据。
5.根据权利要求3所述的3D目标检测方法,其特征在于,所述3D卷积神经网络包括了3层3D卷积层,其中,每一层都包含1层3D卷积层、1个BN操作以及1个Relu激活函数;每一层的卷积核大小在x-y平面上均是3*3,在z轴上的卷积核大小也是3。
6.根据权利要求3所述的3D目标检测方法,其特征在于,在所述3D RPN网络中,对于每一个生成的3D候选区域,通过计算候选区域与GT框在鸟瞰图中的IOU值,并通过预设的IOU阈值,将所得的候选区域划分为正样本、负样本以及其余样本,当前待训练的3D目标检测网络中,将候选区域中包含相同点云数量的正样本和负样本作为训练样本,训练3D RPN网络的参数。
7.根据权利要求3所述的3D目标检测方法,其特征在于,特征提取网络包括了4层全2D卷积块,每层卷积块均包含了3层3D卷积层;其中,每层卷积层之间加入了反卷积操作,在将生成的候选区域输入到特征提取网络中后,通过反卷积操作将低层特征与顶层特征进行融合,融合后的特征提取数据将进一步输入到特征分类网络,在所述特征分类网络中采用softmax分类器,对目标进行分类,计算并输出每个候选区域所属的类别概率,得到3D目标检测结果。
8.一种基于可学习编码的3D目标检测系统,其特征在于,包括以下模块:
网络构建模块,用于构建3D目标检测网络;
数据获取、网络训练模块,用于获取点云数据,并对其进行切割处理,处理后的数据将一部分作为训练数据,另一部分作为待检测数据;其中,将训练数据输入到网络构建模块建立的3D目标检测网络对其进行网络训练;
目标检测模块,用于将待检测数据输入到数据获取、网络训练模块中训练好的网络,在该网络中,经过特征提取、特征分类和坐标回归后,进一步实现基于点云数据的3D目标检测。
9.根据权利要求8所述的3D目标检测系统,其特征在于,数据获取、网络训练模块中还包括数据切割模块,其用于对通过对点云数据进行切割,得到若干个尺寸相同的3D体素网格,实现对输入数据的预处理操作;其中,基于三维空间,在进程切割之前,还需根据预设的X轴、Y轴和Z轴的过滤范围,对输入的点云数据进行范围过滤,所述过滤具体为:在数据空间坐标超过预设的过滤范围时,去除超过该范围的数据部分,并进一步在X轴、Y轴和Z轴上分别使用0.2米,0.2米,0.4米的分辨率,对点云数据进行切割后,得到若干个体素网格。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910785652.3/1.html,转载请声明来源钻瓜专利网。