[发明专利]图像语义分割方法、存储介质和计算机设备在审
申请号: | 202011511465.5 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112560965A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 范筱媛;王磊;林佩珍;程俊 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市铭粤知识产权代理有限公司 44304 | 代理人: | 孙伟峰 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 语义 分割 方法 存储 介质 计算机 设备 | ||
本发明公开了图像语义分割方法、存储介质和计算机设备。该方法包括:初始编码:获取初始点云子集,并利用K近邻算法获取初始点云子集中每个点最近邻的2K个邻域点,构成扩张邻域点集;对扩张邻域点集进行随机抽取,获得由K个邻域点构成的K邻域点集;获取K邻域点集中每个点的增广特征向量;对K邻域点集中每个点的增广特征向量进行注意力池化处理,以获得初始点云子集中每个点的初始编码特征向量;解码:对初始点云子集中每个点的初始编码特征向量进行解码处理,获得初始点云子集中每个点的解码特征向量;预测:根据解码特征向量进行分类预测,获得语义标签信息。本申请使用了邻域扩张,能更好地扩大感受野,学习到更丰富的几何信息。
技术领域
本发明属于图像处理技术领域,具体地讲,涉及图像语义分割方法、计算机可读存储介质、计算机设备。
背景技术
语义分割是将图像中每个像素归于类别标签的计算机视觉任务。三维语义分割对三维场景理解、自动驾驶等领域具有重要作用。近年来,基于三维目标语义分割的算法取得了巨大的进步,然而维数的增加给目标采样带来了计算量的增加,大多数现有方法只能在小规模点云上进行训练和操作。
深度卷积网络在大部分计算机视觉任务中表现出优异的性能,由于深度传感器获取的原始点云通常是不规则的采样、非结构化和无序的,所以不能直接应用这种非结构化数据。
给定一个大尺度的点云数据,它有数百万个点,要用深度学习的方法进行训练和测试,不可避免地需要在每层中逐步的对点进行有效地下采样,而不丢失有用的点特征。
目前已有的方法大多采用最远点采样(Farthest Point Sampling,FPS),即为了从具有N个点(大规模)的点云数据PC中采取K个点,最远点采样返回一个重排列的度量空间{pc1,...,pck,...,pcK}使得每个pck都是距离前面k-1个点最远的点。尽管最远点采样对整个点集有很好的覆盖范围,该方法的计算复杂度是O(n2)级的,所以最远点采样不适合大规模的点云数据。
随机采样则统一地从原始点云数据的N个点中选取K个点。该方法的计算复杂度是O(1),即与总输入点数不相关。与最远点采样相比,随机采样具有很高的效率,且规则简单,处理百万级数量级的点只需要0.004秒。总而言之,随机采样具有以下两个优点:1)随机采样具有很高的计算效率,因为它与输入点的总数无关;2)它不需要额外的内存用于计算。因此,与所有现有的采样方法相比,随机采样是处理大规模点云数据的最合适的方法。然而,由于随机性,随机采样可能丢掉一些关键点的信息。
发明内容
(一)本发明所要解决的技术问题
如何避免在利用随机采样处理大规模点云数据的过程中丢失关键点信息的问题。
(二)本发明所采用的技术方案
一种图像语义分割方法,所述图像语义分割方法包括:
初始编码步骤:
获取初始点云子集,并利用K近邻算法获取所述初始点云子集中每个点最近邻的2K个邻域点,构成扩张邻域点集;
对所述扩张邻域点集进行随机抽取,获得由K个邻域点构成的K邻域点集;
获取所述K邻域点集中每个点的增广特征向量;
对所述K邻域点集中每个点的增广特征向量进行注意力池化处理,以获得所述初始点云子集中每个点的初始编码特征向量;
解码步骤:对所述初始点云子集中每个点的初始编码特征向量进行解码处理,获得所述初始点云子集中每个点的解码特征向量;
预测步骤:根据所述解码特征向量进行分类预测,获得语义标签信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011511465.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序