[发明专利]一种基于扩张点卷积空间金字塔池化的点云语义分割方法在审
申请号: | 201911048539.3 | 申请日: | 2019-10-31 |
公开(公告)号: | CN111027559A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 余洪山;何勇;邹艳梅;杨振耕 | 申请(专利权)人: | 湖南大学;湖南大学深圳研究院 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 扩张 卷积 空间 金字塔 语义 分割 方法 | ||
本发明公开了一种基于扩张点卷积空间金字塔池化的点云语义分割方法,首先通过最远点采样算法获得点云子集中心点,并利用KNN算法确定子集范围;然后通过扩张点卷积空间金字塔池化提取各点云子集特征,增大点卷积的感受野,丰富了场景多尺度目标的特征提取;其次采用简单有效的解码模块实现特征解码,提高了稀疏点云的分割精度;最后通过全连接层实现各个点云的标签分类。本发明的点云语义分割方法具有分割精度高、适应场景多样等突出优点。
技术领域
本发明属于计算机视觉领域,涉及一种基于扩张点卷积空间金字塔池化的 3D语义分割方法。
背景技术
点云语义分割是3D场景解析技术的主要研究难点和热点之一,如何高效快 速的获取点云局部特征、全局特征以及场景上下文信息就成为亟待解决问题。点 云语义分割通过获取场景点云特征,实现逐点分类,达到场景解析的目的。然而, 场景点云具有无序性、稀疏性和密度不均性,另外场景目标具有多尺度特性,这 些因素都严重影响了点云特征的获取。目前,针对点云语义分割的方案主要有多 视角方案、体素化方案,以及直接处理点云方案。其中,多视角方案利用投影方 式获取点云场景不同视角的图像,并输入传统的2D卷积神经网络;体素化方案 将点云划分为3D网格,并利用3D卷积神经网络提取特征;上述两种方案将不 规则点云转化为规则数据,一定程度避免了点云的局限性,但是丢失场景点云的 部分几何信息,引入了量化误差,且分割精度依赖于传统卷积神经网络的性能。 直接处理点云方案因最大化保留点云信息,受到越来越多的关注。点云语义分割 网络为了获取不同尺度上下文信息,常采用点云多尺度分组方式,容易造成更多 的计算成本。另外,现有点云语义分割网络的局部特征、上下文信息获取能力仍 有待提高。
如何提高局部特征和上下文信息获取能力,以及降低网络计算成本是本领域 的主要急需解决的技术问题。
发明内容
本发明针对上述问题,提出一种基于扩张点卷积空间金字塔池化的点云语义 分割方法。
一种基于扩张点卷积空间金字塔的点云语义分割方法,包括以下步骤:
步骤1:基于ScanNet数据集点云,采用最远点采样算法获取点云子集中心 点;
所述网络的输入点云分别为P{p1,p2,p3…,pn},特征为F,使用迭代最远点采 样算法从输入点云中选择出子集Psub-i{Pi1,Pi2,Pi3,…,Pim},使得Pij与子集中其他 点距离最远;
步骤2:基于步骤1中获得的点云子集中心点,利用最近邻算法确定点云子 集的范围;
输入形式为P×(D+C)和P1×D的矩阵信息,输出形式为P1×K1×(D+C) 矩阵信息。其中,P为输入点云个数,P1为下采样中心点个数,D为各点的D维 坐标信息,C为C维点特征信息,K1为中心点邻域点的个数;
通过KNN算法搜索出K1个距离中心点最近的邻域点,并根据各邻域点到中 心点的距离大小对相应邻域点排序编号。K1个领域点与中心点组成中心点邻域, 也称作局部邻域。
步骤3:利用改进型扩张点卷积空间金字塔池化提取局部邻域特征F1,并得 到P1个抽象点;
输入形式为P1×K1×(D+C)的矩阵信息,输出形式为P1×(D+C″)的矩阵 信息。其中,C″为改进型扩张点卷积空间金字塔池化在局部邻域抽象得到的点 特征维度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学;湖南大学深圳研究院,未经湖南大学;湖南大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911048539.3/2.html,转载请声明来源钻瓜专利网。