[发明专利]一种用于工业零件测量的高精度图像语义分割方法有效
申请号: | 202010281361.3 | 申请日: | 2020-04-10 |
公开(公告)号: | CN111488882B | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 王磊;吴伟龙;周建品;李争 | 申请(专利权)人: | 视研智能科技(广州)有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 张金福 |
地址: | 510925 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 工业 零件 测量 高精度 图像 语义 分割 方法 | ||
本发明涉及一种用于工业零件测量的高精度图像语义分割方法,所述方法包括:S1:构建并训练神经网络模型;S2:将图像输入训练好的模型进行在线检测,实现图像的语义分割;其中,神经网络模型(1)采用PSPNet作为图像特征提取器;(2)采用几何池化层的池化方法,来替换传统的全局池化;(3)采用迭代概率图对概率图进行优化。本发明通过对目标的几何形状进行学习和建模,利用几何形状信息对提取的目标的边界进行优化,可以显著提高现有基于CNN的语义分割模型的准确度和适应性及鲁棒性,相比传统算法可大幅度提高边界和细小结构的提取精度;可以提取简洁精确的目标边界。
技术领域
本发明涉及图像语义分割领域,更具体地,涉及一种用于工业零件测量的高精度图像语义分割方法。
背景技术
基于视觉的工业零件检测和分割要求图像语义分割结果具备非常精准的边界,而且能正确识别目标上的细小的结构。但是受遮挡,阴影,纹理缺乏,纹理混淆,噪声等因素的影响,目标边界在图像上往往是不可见或者模糊的。在这些情况下,现有的卷积神经网络(CNN)的语义分割模型往往会在目标边界周围出现错误识别的情况,因为绝大部分现有的CNN模型没有考虑到如何在图像信息缺失时正确识别目标。
在图像信息缺失时正确识别目标需要利用目标周围的上下文信息等长距离的相关性对目标进行推理。比如金字塔空间池化层(Pyramid Spatial Pooling)利用全局信息帮助局部目标识别,对长距离的相关性有一定的建模能力。注意力机制可以提取和使用相关的上下文区域,在一定程度上提高语义分割的精度。生成式对抗神经网络(GAN)或者视觉损失函数则通过惩罚预测结果的异质性,从而在整体上提高预测结果的一致性。但是这种提升全局一致性的技术并没有表明可以改进现有的CNN模型在目标边界和细节上的识别能力。
发明内容
本发明为克服上述现有技术所述的工业零件边界检测中边界和细小结构的提取精度不够高的缺陷,提供一种用于工业零件测量的高精度图像语义分割方法。
所述方法包括:
S1:构建并训练神经网络模型;
S2:将图像输入训练好的模型进行在线检测,实现图像的语义分割;
其中,神经网络模型(1)采用PSPNet作为图像特征提取器;
(2)采用几何池化层的池化方法,来替换传统的全局池化;
(3)采用迭代概率图对概率图进行优化。
优选地,神经网络模型的训练包括以下步骤:
S1.1:人工勾画训练样本数据集,并生成真值图;
S1.2:将图像和其对应的真值图切分成相同尺寸的若干小图和对应的真值图;使用生成的所有的小图及其对应的真值图作为训练样本;
S1.3:随机选取一个训练样本,对训练样本进行预处理,得到增强样本;
S1.4:使用PSPNet-ResNet101前向传播提取增强样本图像的特征向量;
S1.5:在多波段特征图上使用若干个Conv-BN-ReLu-Conv-BN结构分别预测像素级分类结果,关键点以及目标边界点;使用交叉熵损失函数计算损失;
S1.6:对几何池化层进行池化;获取特征图的特征向量;
S1.7:将S1.6所得到的特征向量与S1.4提取增强样本图像的特征向量串联得到更新的特征图;
S1.8:采用Conv-BN-ReLU-Conv-BN结构对S1.7生成的更新的特征图进行像素级别的分类,对每个像素位置进行语义分割,生成目标语义分割的概率图,
并使用交叉熵损失函数计算其样本分类损失;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于视研智能科技(广州)有限公司,未经视研智能科技(广州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010281361.3/2.html,转载请声明来源钻瓜专利网。