[发明专利]一种端到端生成建议框的自底向上的三维目标检测方法在审
申请号: | 202111466037.X | 申请日: | 2021-12-03 |
公开(公告)号: | CN114241225A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 张小瑞;赵紫权;孙伟;刘青山;袁晓彤 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/26;G06V10/44;G06V10/82;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 赵华 |
地址: | 224002 江苏省盐城*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 端到端 生成 建议 向上 三维 目标 检测 方法 | ||
本发明公开了一种端到端生成建议框的自底向上的三维目标检测方法,属于人工智能的目标检测领域。首先通过Ball k‑means聚类算法处理原始点云获取聚类中心,将原始点云划分为多个球形类簇,将每个球形类簇里边的原始点云输入到PointNet编码和解码器中,获得输入点的逐点级语义特征;然后Shell‑based方法计算建议框几何中心,通过前景点语义分割,得到前景掩膜,端到端的生成建议框;然后对点云区域池化,进行空间坐标转化,经过多层感知机,与语义特征进行特征融合;对融合后的特征进行PointNet编码;通过总损失函数,进行Shell‑based分类回归到几何中心。
技术领域
本发明涉及一种端到端生成建议框的自底向上的三维目标检测方法,属于人工智能的目标检测领域。
背景技术
自动驾驶近年来家喻户晓,国内外学者、公司对此领域的研究热情高涨。与传统二维图像的目标检测不同的是:在自动驾驶场景中,以三维点云数据作为输入,将标注三维物体的3D边界框很好地分隔开。使得对三维空间中汽车、行人等目标的检测更具现实意义。
传统的,如二维空间中,fast-RCNN、SSD和YOLOv3,以从摄像机中获得的二维信息作为输入,这些网络架构在许多图像特征方面表现出很高的准确性。这些方法为三维目标检测提供了很好的思路。在此之前,应用较多的还有PointNet、PointNet++等三维目标检测方法。但这些三维目标检测方法中,通常采用的是直接回归几何中心的方式。这种通过聚类中心直接回归几何中心效果不理想,往往需要多轮回归才可以获得几何中心,收敛速度不够快。
发明内容
针对背景技术中提到的不足,本发明提供了一种准确高效的端到端生成建议框的自底向上的三维目标检测方法。
本发明的技术方案:
本发明提供了一种端到端生成建议框的自底向上的三维目标检测方法,其步骤如下:
(1)通过Ball k-means聚类算法处理原始点云获取聚类中心,将所述原始点云划分为多个球形类簇,并且得到每一个球形类簇的聚类中心O和聚类半径R;
(2)将每一个球形类簇里边的原始点云输入到PointNet编码和解码器中,获得每一个输入点的逐点级语义特征;
(3)分别通过Shell-based方法计算建议框的几何中心,通过前景点语义分割,得到前景掩膜,端到端的生成建议框;
(4)点云区域池化操作,对于所述原始点云、前景掩膜分离出局部空间点,进行空间坐标转化,经过多层感知机(MLP),与所述语义特征进行特征融合;
(5)对融合后的特征进行PointNet编码;
(6)通过总损失函数进行Shell-based分类回归得到最终的几何中心,预测置信度,抑制多余的三维检测框,得到最后的三维检测框。
进一步地,步骤(1)中,所述通过Ball k-means聚类算法处理原始点云获取聚类中心具体包括如下步骤:
对于任意一个球形类簇C,可以用(O,R)表示,聚类中心O可以表示为:
其中N表示球形类簇C中点云个数,i表示计数器,pi表示球形类簇C第i个任意点,R表示球形类簇的聚类半径;
给定两个球形类簇Ci和Cj,其聚类中心表示为Oi和Oj;Ri表示Ci的聚类半径,如果Ri满足以下不等式:
其中Ci和Cj分别表示为第i个和第j个相邻球形类簇,i和j表示计数器,Oi和Oj分别表示Ci和Cj的聚类中心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111466037.X/2.html,转载请声明来源钻瓜专利网。