[发明专利]一种端到端生成建议框的自底向上的三维目标检测方法在审

专利信息
申请号: 202111466037.X 申请日: 2021-12-03
公开(公告)号: CN114241225A 公开(公告)日: 2022-03-25
发明(设计)人: 张小瑞;赵紫权;孙伟;刘青山;袁晓彤 申请(专利权)人: 南京信息工程大学
主分类号: G06V10/762 分类号: G06V10/762;G06V10/26;G06V10/44;G06V10/82;G06N3/04;G06N3/08;G06K9/62
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 赵华
地址: 224002 江苏省盐城*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 端到端 生成 建议 向上 三维 目标 检测 方法
【权利要求书】:

1.一种端到端生成建议框的自底向上的三维目标检测方法,其步骤如下:

(1)通过Ball k-means聚类算法处理原始点云获取聚类中心,将所述原始点云划分为多个球形类簇,并且得到球形类簇的聚类中心O和聚类半径R;

(2)将每一个球形类簇里边的原始点云输入到PointNet编码解码器中,获得每一个输入点的逐点级语义特征;

(3)分别通过Shell-based方法计算建议框的几何中心,通过前景点语义分割,得到前景掩膜,端到端的生成建议框;

(4)点云区域池化操作,对于所述原始点云、前景掩膜分离出局部空间点,进行空间坐标转化,经过多层感知机(MLP),与所述语义特征进行特征融合;

(5)对融合后的特征进行PointNet编码;

(6)通过总损失函数进行Shell-based分类回归得到最终的几何中心,预测置信度,抑制多余的三维检测框,得到最后的三维检测框。

2.根据权利要求1所述的三维目标检测方法,其特征在于,步骤(1)中,所述通过Ballk-means聚类算法处理原始点云获取聚类中心具体包括如下步骤:

对于任意一个球形类簇C,可以用(O,R)表示,聚类中心O可以表示为:

其中N表示球形类簇C中点云个数,i表示计数器,pi表示球形类簇C第i个任意点,R表示球形类簇的聚类半径;

给定两个球形类簇Ci和Cj,其聚类中心表示为Oi和Oj;Ri表示Ci的聚类半径,如果Ri满足以下不等式:

其中Ci和Cj分别表示为第i个和第j个相邻球形类簇,i和j表示计数器,Oi和Oj分别表示Ci和Cj的聚类中心。

3.根据权利要求2所述的三维目标检测方法,其特征在于,步骤(3)中,所述通过Shell-based方法计算几何中心具体包括如下步骤:以聚类中心O为空间的中心,将球形类簇的聚类半径R三等分,r1=R/3,r2=2R/3,r3=R,以r1,r2,r3为半径的三个同心球划分为三个空间域(Shell1,Shell2,Shell3),其中Shell1呈现为球,Shell2、Shell3呈现为球壳,这三个空间域的球坐标系半径r用如下集合表示:{0≤r<r1,r1≤r<r2,r2≤r≤r3};

在球坐标系下,聚类中心O(xO,yO,zO)的球坐标表示为O(xO,yO,zO)与的映射关系通过如下公式表示:

zO=rOcosαO

其中表示聚类中心O在球坐标的方向角,αO表示聚类中心O在球坐标系下的天顶角,rO表示聚类中心O在球坐标的半径,把这种映射关系记作从笛卡尔坐标映射到球坐标系下,用如下公式表示:

把这种映射关系记作

则Shell=(Shell1,Shell2,Shell3)用如下公式表示:

其中Δr,α,分别表示在球坐标系下的半径偏移量,天顶角,方向角;r表示三个空间域的球坐标系半径;对于划分好之后的球形类簇,当作三种不同的分类类别,在经过设计好的深度神经网络中,经过计算,反向传播,分类出几何中心O′处于Shell1,Shell2,Shell3哪一个中,再通过回归的方法,计算出Δr,α,然后通过映射关系计算出笛卡尔坐标系下相应的几何中心O′的x,y,z坐标(xO′,yO′,zO′)。

4.根据权利要求3所述的三维目标检测方法,其特征在于,步骤(6)中,所述通过总损失函数微调建议框,得到三维检测框BBox,具体包括步骤如下:

(1)所述Shell-based方法,对几何中心O′所属Shell的分类可以表示为:

其中,是其对应对象的几何中心O′坐标预测值映射后的结果,是其对应对象的几何中心O′坐标真实值映射后的结果,S表示对应的搜索范围,u泛指x、y、z坐标;

在指定Shell内,进一步位置细化在沿x,y和z轴与真实值残差可以表示为:

其中,和是几何中心O′坐标(x,y,z)的真实值在Shell划分中的换算值,R表示球形类簇的聚类半径;

所述Shell-based方法的损失

其中,是二元交叉熵损失,表示几何中心O′坐标属于哪一个Shell的真实值,是几何中心O′坐标属于哪一个Shell的预测值,表示Smooth-L1损失,表示残差部分的真实值,表示残差部分的预测值;

(2)置信度损失

其中,GIoU表示边框损失函数,IoU表示BBox(Bounding Box)与真实值的交并比,A表示包围BBox和真实值的最小立方体区域体积,u表示BBox与真实值的并集体积;是第i个预测值Conf通过Sigmoid函数得到的预测置信度;Ti表示第i个BBox与真实值重合度;K为正负样本个数;

(3)所有目标检测的总损失定义如下:

其中,Npos表示正样本个数,λconf、λloc、λcls、λdir、λShell分别表示置信度损失、定位损失、分类损失、方向角损失的平衡系数、Shell-based定位损失的平衡系数,分别表示置信度损失、定位损失、分类损失、方向角损失、Shell-based定位损失。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111466037.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top