[发明专利]一种端到端生成建议框的自底向上的三维目标检测方法在审
申请号: | 202111466037.X | 申请日: | 2021-12-03 |
公开(公告)号: | CN114241225A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 张小瑞;赵紫权;孙伟;刘青山;袁晓彤 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/26;G06V10/44;G06V10/82;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 赵华 |
地址: | 224002 江苏省盐城*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 端到端 生成 建议 向上 三维 目标 检测 方法 | ||
1.一种端到端生成建议框的自底向上的三维目标检测方法,其步骤如下:
(1)通过Ball k-means聚类算法处理原始点云获取聚类中心,将所述原始点云划分为多个球形类簇,并且得到球形类簇的聚类中心O和聚类半径R;
(2)将每一个球形类簇里边的原始点云输入到PointNet编码解码器中,获得每一个输入点的逐点级语义特征;
(3)分别通过Shell-based方法计算建议框的几何中心,通过前景点语义分割,得到前景掩膜,端到端的生成建议框;
(4)点云区域池化操作,对于所述原始点云、前景掩膜分离出局部空间点,进行空间坐标转化,经过多层感知机(MLP),与所述语义特征进行特征融合;
(5)对融合后的特征进行PointNet编码;
(6)通过总损失函数进行Shell-based分类回归得到最终的几何中心,预测置信度,抑制多余的三维检测框,得到最后的三维检测框。
2.根据权利要求1所述的三维目标检测方法,其特征在于,步骤(1)中,所述通过Ballk-means聚类算法处理原始点云获取聚类中心具体包括如下步骤:
对于任意一个球形类簇C,可以用(O,R)表示,聚类中心O可以表示为:
其中N表示球形类簇C中点云个数,i表示计数器,pi表示球形类簇C第i个任意点,R表示球形类簇的聚类半径;
给定两个球形类簇Ci和Cj,其聚类中心表示为Oi和Oj;Ri表示Ci的聚类半径,如果Ri满足以下不等式:
其中Ci和Cj分别表示为第i个和第j个相邻球形类簇,i和j表示计数器,Oi和Oj分别表示Ci和Cj的聚类中心。
3.根据权利要求2所述的三维目标检测方法,其特征在于,步骤(3)中,所述通过Shell-based方法计算几何中心具体包括如下步骤:以聚类中心O为空间的中心,将球形类簇的聚类半径R三等分,r1=R/3,r2=2R/3,r3=R,以r1,r2,r3为半径的三个同心球划分为三个空间域(Shell1,Shell2,Shell3),其中Shell1呈现为球,Shell2、Shell3呈现为球壳,这三个空间域的球坐标系半径r用如下集合表示:{0≤r<r1,r1≤r<r2,r2≤r≤r3};
在球坐标系下,聚类中心O(xO,yO,zO)的球坐标表示为O(xO,yO,zO)与的映射关系通过如下公式表示:
zO=rOcosαO
其中表示聚类中心O在球坐标的方向角,αO表示聚类中心O在球坐标系下的天顶角,rO表示聚类中心O在球坐标的半径,把这种映射关系记作从笛卡尔坐标映射到球坐标系下,用如下公式表示:
把这种映射关系记作
则Shell=(Shell1,Shell2,Shell3)用如下公式表示:
其中Δr,α,分别表示在球坐标系下的半径偏移量,天顶角,方向角;r表示三个空间域的球坐标系半径;对于划分好之后的球形类簇,当作三种不同的分类类别,在经过设计好的深度神经网络中,经过计算,反向传播,分类出几何中心O′处于Shell1,Shell2,Shell3哪一个中,再通过回归的方法,计算出Δr,α,然后通过映射关系计算出笛卡尔坐标系下相应的几何中心O′的x,y,z坐标(xO′,yO′,zO′)。
4.根据权利要求3所述的三维目标检测方法,其特征在于,步骤(6)中,所述通过总损失函数微调建议框,得到三维检测框BBox,具体包括步骤如下:
(1)所述Shell-based方法,对几何中心O′所属Shell的分类可以表示为:
其中,是其对应对象的几何中心O′坐标预测值映射后的结果,是其对应对象的几何中心O′坐标真实值映射后的结果,S表示对应的搜索范围,u泛指x、y、z坐标;
在指定Shell内,进一步位置细化在沿x,y和z轴与真实值残差可以表示为:
其中,和是几何中心O′坐标(x,y,z)的真实值在Shell划分中的换算值,R表示球形类簇的聚类半径;
所述Shell-based方法的损失
其中,是二元交叉熵损失,表示几何中心O′坐标属于哪一个Shell的真实值,是几何中心O′坐标属于哪一个Shell的预测值,表示Smooth-L1损失,表示残差部分的真实值,表示残差部分的预测值;
(2)置信度损失
其中,GIoU表示边框损失函数,IoU表示BBox(Bounding Box)与真实值的交并比,A表示包围BBox和真实值的最小立方体区域体积,u表示BBox与真实值的并集体积;是第i个预测值Conf通过Sigmoid函数得到的预测置信度;Ti表示第i个BBox与真实值重合度;K为正负样本个数;
(3)所有目标检测的总损失定义如下:
其中,Npos表示正样本个数,λconf、λloc、λcls、λdir、λShell分别表示置信度损失、定位损失、分类损失、方向角损失的平衡系数、Shell-based定位损失的平衡系数,分别表示置信度损失、定位损失、分类损失、方向角损失、Shell-based定位损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111466037.X/1.html,转载请声明来源钻瓜专利网。