[发明专利]一种用于卷积神经网络训练数据的自动化标记方法在审
申请号: | 202110405677.3 | 申请日: | 2021-04-15 |
公开(公告)号: | CN112966786A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 李静雅;王东杰;郭志鹏;樊昊 | 申请(专利权)人: | 宁波九寰适创科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京中企鸿阳知识产权代理事务所(普通合伙) 11487 | 代理人: | 苏艳 |
地址: | 315800 浙江省宁波市北仑*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 卷积 神经网络 训练 数据 自动化 标记 方法 | ||
本发明提出了一种用于卷积神经网络训练数据的自动化标记方法,包括:步骤S1,提取基本缺陷特征;步骤S2,特征摘取和样本裁剪,包括:根据所述步骤S1中获取的特征蒙板,结合孤立域方法获取每个缺陷体的中心位置和形状大小,并以该集合中的点作为中心,同时对图像施加基本变换操作以增加样本数量,同时裁剪出预设规格的样本;步骤S3,对所述步骤S2中得到的样本进行特征轮廓提取,并进行类别标记;步骤S4,基于共享内存并行系统OpenmMP的并行优化。
技术领域
本发明涉及神经网络训练技术领域,特别涉及一种用于卷积神经网络训练数据的自动化标记方法。
背景技术
以深度学习为主流的卷积神经网络模型的训练在原理上为了得到可靠的计算结果,需要大量标记图像作为输入数据(万以上数量级)。在实际应用中,当前普遍由人工手动标记这些输入图像样本,人工成本及时间成本巨大,无法与机器实际训练计算效率相匹配。这一效率差异使得深度学习训练结果收获速度往往受制于人工标记效率。另一方面,人工标记数据尚未建立可量化的评价标准,且数据量巨大复查成本高昂,不同人员制作的数据样本的差异造成的不确定性使得实际训练计算收敛效果不佳。
发明内容
本发明的目的旨在至少解决所述技术缺陷之一。
为此,本发明的目的在于提出一种用于卷积神经网络训练数据的自动化标记方法。
为了实现上述目的,本发明的实施例提供一种用于卷积神经网络训练数据的自动化标记方法,包括如下步骤:
步骤S1,提取基本缺陷特征;
步骤S2,特征摘取和样本裁剪,包括:根据所述步骤S1中获取的特征蒙板,结合孤立域方法获取每个缺陷体的中心位置和形状大小,并以该集合中的点作为中心,同时对图像施加基本变换操作以增加样本数量,同时裁剪出预设规格的样本;
步骤S3,对所述步骤S2中得到的样本进行特征轮廓提取,并进行类别标记;
步骤S4,基于共享内存并行系统OpenmMP的并行优化。
进一步,在所述步骤S1中,包括如下步骤:
(1)读入图像数据并压缩;
(2)高斯过滤:对图像数据进行高斯处理;
(3)图像插值:对高斯处理后的图像数据进行插值处理;
(4)图像强化:对插值处理后的图像数据进行强化处理;
(5)图像自适应二值化;
(6)图像清创。
进一步,在所述步骤S2中,所述孤立域方法采用骨架提取和分水岭方法。
进一步,在所述步骤S3中,对所述步骤S2中得到的样本,在一次迭代的计算量下直接获取到二值图边界,对缺陷特征进行轮廓描述以及类别标记,写到对应配置文件中。
根据本发明实施例的用于卷积神经网络训练数据的自动化标记方法,基于Gaussian与USM方法,实现明显缺陷特征的自动化批量提取;同时高速生成统一化的缺陷训练样本,建立全自动样本生成机制,实现了样本标记效率与训练计算效率的匹配。高斯滤波是常见的噪声平滑算子,当配合新兴的非掩膜锐化方法时,能够将局部边界的对比度提升至极限。本发明利用这一特性,可以顺利摘取物体内部较为明显的异物。此外,本发明基于OpenMP并行模型,其算法核心采用串联的高斯滤波、非掩膜锐化等方法,可处理缺陷平均大小在3像素*3像素以上的灰度图像。本发明通过对数据处理算法架构以及数据存储方式的多次优化,经测试在16核范围内,并行效率基本呈现线性增长;相较传统图像标记效率,有效标记效率得到四个数量级提升。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波九寰适创科技有限公司,未经宁波九寰适创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110405677.3/2.html,转载请声明来源钻瓜专利网。