[发明专利]针对工业视觉应用的预训练数据筛选及训练方法、系统在审

专利信息
申请号: 202110753850.9 申请日: 2021-07-03
公开(公告)号: CN113420824A 公开(公告)日: 2021-09-21
发明(设计)人: 严鼎天;张亮;孙海;高全亮;郑荣;周涛;丁香 申请(专利权)人: 上海理想信息产业(集团)有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 上海方澜知识产权代理事务所(普通合伙) 31440 代理人: 李娜
地址: 201315 上海市浦东*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 针对 工业 视觉 应用 训练 数据 筛选 方法 系统
【说明书】:

发明实施例涉及工业场景视觉检测技术应用领域,公开了一种多针对工业视觉应用的预训练数据筛选及训练方法、系统。该方法包括:利用开源数据集训练目标检测网络得到预训练网络M1;利用预训练网络M1计算并统计得到开源数据集中每个类别的特征,建立特征库L1;利用检测目标的训练集训练调整预训练网络M1;利用调整后的预训练网络M1统计得到检测目标的训练集中每个类别的特征;利用距离函数从特征库L1中筛选出与检测目标的每个类别的特征匹配的目标类别;保存开源数据集中与目标类别对应的训练数据作为目标检测网络的目标预训练数据。本发明实施例可从开源数据集中挖掘与当前任务相关性更强的预训练数据,从而提升模型的准确度,稳定性和可用性。

技术领域

本发明涉及工业场景视觉检测技术应用领域,特别涉及一种针对工业视觉应用的预训练数据筛选及训练方法、系统。

背景技术

工业视觉任务中普遍采用预训练模型和调优训练之训练策略,加速算法模型训练速度,提升模型学习能力,保障基于深度学习的视觉算法落地应用。但由于工业视觉任务具有高精度和稳定性等硬性要求使算法模型过度训练,导致同一个算法和预训练数据很难在多个场景中泛化复用。因此,随着开源预训练模型与开源数据集数量快速增长,如何从海量开源数据集中选择最适合当前场景任务的预训练数据集已成为推动算法落地的关键步骤。当预训练数据与当前任务目标相似性较强时,算法在训练时将会更聚焦于任务细节,显著提升算法识别能力和稳定性;反之,训练过程中就会产生负迁移等问题,使算法模型的迭代更新变得混乱,降低算法工作效率。比如说人会骑自行车,那么经过少量训练就可以学会骑摩托车,但是想用骑自行车的经验开飞机,那显然是不可能的。

目前大部分工业视觉任务仍依靠主观意识选择预训练数据,缺乏对知识迁移的控制能力和可解释性。同时,盲目选择预训练数据不利于算法模型的后续优化工作。

发明内容

本发明实施例的目的在于提供一种针对工业视觉应用的预训练数据筛选及训练方法、系统,旨在利用距离函数筛选外部开源数据中的可迁移类别,提升预训练数据质量,以提升模型的准确度、稳定性和可用性。

为解决上述技术问题,第一方面,本发明实施例提供了一种针对工业视觉应用的预训练数据筛选方法,包括:

采集检测目标的训练集,获取开源数据集;

利用所述开源数据集训练目标检测网络得到预训练网络M1;所述预训练网络M1包含预训练骨干网络B1;

利用所述预训练网络M1计算并统计得到所述开源数据集中每个类别的特征,建立特征库L1;所述特征库L1包含所述每个类别对应的特征记忆单元,每个所述特征记忆单元包含对应类别的池化层特征以及类别标签;

利用所述检测目标的训练集训练调整所述预训练网络M1;

利用调整后的所述预训练网络M1统计得到所述检测目标的训练集中每个类别的特征;

利用距离函数从所述特征库L1中筛选出与所述检测目标的每个类别的特征匹配的目标类别;

保存所述开源数据集中与所述目标类别对应的训练数据作为所述目标检测网络的目标预训练数据。

另外,所述利用所述预训练网络M1计算并统计得到所述开源数据集中每个类别的特征,包括:从所述开源数据集中为每个类别随机抽取预设数量的图片;将每个类别的每张图片分别输入所述预训练网络M1,将所述预训练骨干网络B1的最后一个卷积层输出的卷积层特征作为每张图片的卷积层特征;对卷积层特征每一个通道的特征图取全局最大值,得到所述每张图片的池化层特征;对每个该类别所有图片的池化层特征求平均,得到对应类别的池化层特征。

另外,每个类别随机抽取的图片的数量相同。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理想信息产业(集团)有限公司,未经上海理想信息产业(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110753850.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top