[发明专利]一种端到端生成建议框的自底向上的三维目标检测方法在审

申请号：	202111466037.X	申请日：	2021-12-03
公开（公告）号：	CN114241225A	公开（公告）日：	2022-03-25
发明（设计）人：	张小瑞;赵紫权;孙伟;刘青山;袁晓彤	申请（专利权）人：	南京信息工程大学
主分类号：	G06V10/762	分类号：	G06V10/762;G06V10/26;G06V10/44;G06V10/82;G06N3/04;G06N3/08;G06K9/62
代理公司：	南京经纬专利商标代理有限公司 32200	代理人：	赵华
地址：	224002 江苏省盐城***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种端到端生成建议向上三维目标检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种端到端生成建议框的自底向上的三维目标检测方法，其步骤如下：

(1)通过Ball k-means聚类算法处理原始点云获取聚类中心，将所述原始点云划分为多个球形类簇，并且得到球形类簇的聚类中心O和聚类半径R；

(2)将每一个球形类簇里边的原始点云输入到PointNet编码解码器中，获得每一个输入点的逐点级语义特征；

(3)分别通过Shell-based方法计算建议框的几何中心，通过前景点语义分割，得到前景掩膜，端到端的生成建议框；

(4)点云区域池化操作，对于所述原始点云、前景掩膜分离出局部空间点，进行空间坐标转化，经过多层感知机(MLP)，与所述语义特征进行特征融合；

(5)对融合后的特征进行PointNet编码；

(6)通过总损失函数进行Shell-based分类回归得到最终的几何中心，预测置信度，抑制多余的三维检测框，得到最后的三维检测框。

2.根据权利要求1所述的三维目标检测方法，其特征在于，步骤(1)中，所述通过Ballk-means聚类算法处理原始点云获取聚类中心具体包括如下步骤：

对于任意一个球形类簇C，可以用(O，R)表示，聚类中心O可以表示为：

其中N表示球形类簇C中点云个数，i表示计数器，p_i表示球形类簇C第i个任意点，R表示球形类簇的聚类半径；

给定两个球形类簇C_i和C_j，其聚类中心表示为O_i和O_j；R_i表示C_i的聚类半径，如果R_i满足以下不等式：

其中C_i和C_j分别表示为第i个和第j个相邻球形类簇，i和j表示计数器，O_i和O_j分别表示C_i和C_j的聚类中心。

3.根据权利要求2所述的三维目标检测方法，其特征在于，步骤(3)中，所述通过Shell-based方法计算几何中心具体包括如下步骤：以聚类中心O为空间的中心，将球形类簇的聚类半径R三等分，r₁＝R/3，r₂＝2R/3，r₃＝R，以r₁，r₂，r₃为半径的三个同心球划分为三个空间域(Shell₁，Shell₂，Shell₃)，其中Shell₁呈现为球，Shell₂、Shell₃呈现为球壳，这三个空间域的球坐标系半径r用如下集合表示：{0≤r＜r₁，r₁≤r＜r₂，r₂≤r≤r₃}；

在球坐标系下，聚类中心O(x_O，y_O，z_O)的球坐标表示为O(x_O，y_O，z_O)与的映射关系通过如下公式表示：

z_O＝r_Ocosα_O

其中表示聚类中心O在球坐标的方向角，α_O表示聚类中心O在球坐标系下的天顶角，r_O表示聚类中心O在球坐标的半径，把这种映射关系记作从笛卡尔坐标映射到球坐标系下，用如下公式表示：

把这种映射关系记作

则Shell＝(Shell₁，Shell₂，Shell₃)用如下公式表示：

其中Δr，α，分别表示在球坐标系下的半径偏移量，天顶角，方向角；r表示三个空间域的球坐标系半径；对于划分好之后的球形类簇，当作三种不同的分类类别，在经过设计好的深度神经网络中，经过计算，反向传播，分类出几何中心O′处于Shell₁，Shell₂，Shell₃哪一个中，再通过回归的方法，计算出Δr，α，然后通过映射关系计算出笛卡尔坐标系下相应的几何中心O′的x，y，z坐标(x_O′，y_O′，z_O′)。

4.根据权利要求3所述的三维目标检测方法，其特征在于，步骤(6)中，所述通过总损失函数微调建议框，得到三维检测框BBox，具体包括步骤如下：

(1)所述Shell-based方法，对几何中心O′所属Shell的分类可以表示为：

其中，是其对应对象的几何中心O′坐标预测值映射后的结果，是其对应对象的几何中心O′坐标真实值映射后的结果，S表示对应的搜索范围，u泛指x、y、z坐标；

在指定Shell内，进一步位置细化在沿x，y和z轴与真实值残差可以表示为：

其中，和是几何中心O′坐标(x，y，z)的真实值在Shell划分中的换算值，R表示球形类簇的聚类半径；

所述Shell-based方法的损失

其中，是二元交叉熵损失，表示几何中心O′坐标属于哪一个Shell的真实值，是几何中心O′坐标属于哪一个Shell的预测值，表示Smooth-L1损失，表示残差部分的真实值，表示残差部分的预测值；

(2)置信度损失

其中，G_IoU表示边框损失函数，IoU表示BBox(Bounding Box)与真实值的交并比，A表示包围BBox和真实值的最小立方体区域体积，u表示BBox与真实值的并集体积；是第i个预测值Conf通过Sigmoid函数得到的预测置信度；T_i表示第i个BBox与真实值重合度；K为正负样本个数；

(3)所有目标检测的总损失定义如下：

其中，N_pos表示正样本个数，λ_conf、λ_loc、λ_cls、λ_dir、λ_Shell分别表示置信度损失、定位损失、分类损失、方向角损失的平衡系数、Shell-based定位损失的平衡系数，分别表示置信度损失、定位损失、分类损失、方向角损失、Shell-based定位损失。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京信息工程大学，未经南京信息工程大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111466037.X/1.html，转载请声明来源钻瓜专利网。

上一篇：用于肺部动态通气功能快速定量评估的气体MRI方法
下一篇：一种节能环保空调空气净化系统

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种端到端生成建议框的自底向上的三维目标检测方法在审

专利文献下载