[发明专利]基于深度学习检测任务的增量学习方法、装置及存储介质在审
申请号: | 202211160029.7 | 申请日: | 2022-09-22 |
公开(公告)号: | CN115496203A | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 龙睿杰;彭斌 | 申请(专利权)人: | 深圳市凌云视迅科技有限责任公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;温瑞鑫 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 检测 任务 增量 学习方法 装置 存储 介质 | ||
本申请涉及工业视觉技术领域,具体而言,涉及基于深度学习检测任务的增量学习方法、装置及存储介质,一定程度上可以解决重新训练新目标检测模型,需要耗费大量的时间和资源的问题。所述基于深度学习检测任务的增量学习方法包括:利用已有图像数据集生成GAN模型,GAN模型用于生成包含若干假图像的假图像数据集;整合假图像数据集和新图像数据集,得到混合图像数据集;加载旧目标检测模型,旧目标检测模型基于已有图像数据生成,获取旧目标检测模型的旧模型参数,旧模型参数用于确定新模型初始参数;基于混合图像数据集和新模型初始参数,训练得到新目标检测模型,其中,新目标检测模型的训练轮数根据旧模型的收敛轮数确定。
技术领域
本申请涉及工业视觉技术领域,具体而言,涉及基于深度学习检测任务的增量学习方法、装置及存储介质。
背景技术
目标检测是基于深度学习进行的任务,被用于在一张图片中找到特定的物体,目标检测不仅要求对物体的种类进行识别,同时要求对物体的位置进行标记。在缺陷检测应用目标检测模型表现明显优于传统图像处理算法。
但是受限于已有训练数据的数量不足,目标检测模型的泛化能力有限。随着检测任务多样性的提高,新图像数据也越来越多,使得目标检测模型对新图像数据的预测精准度降低。
为提高目标检测模型的泛化能力使其适应多样的检测任务,需要频繁重新训练新的目标检测模型,但是重新训练新目标检测模型,需要耗费大量的时间和资源。
发明内容
为了解决重新训练新目标检测模型,需要耗费大量的时间和资源的问题,本申请提供了基于深度学习检测任务的增量学习方法、装置及存储介质。
本申请的实施例是这样实现的:
本申请实施例提供一种基于深度学习检测任务的增量学习方法,所述方法包括:
利用已有图像数据集生成GAN模型,所述GAN模型用于生成包含若干假图像的假图像数据集;
整合所述假图像数据集和新图像数据集,得到混合图像数据集;
加载旧目标检测模型,所述旧目标检测模型基于已有图像数据生成,获取所述旧目标检测模型的旧模型参数,所述旧模型参数用于确定新模型初始参数;
基于所述混合图像数据集和所述新模型初始参数,训练得到新目标检测模型,其中,所述新目标检测模型的训练轮数根据所述旧目标检测模型的收敛轮数确定。
在一些实施例中,所述整合所述假图像数据集和新图像数据集,进一步包括:
对所述假图像数据集进行筛选,得到一系列具有相似特征的假数据样本,其中,筛选时所采用的的方法为聚类分析法、主成分分析法或计算欧氏距离法;
将假数据样本和新图像数据集进行整合。
在一些实施例中,所述假图像数据集按照预设比例分为训练集和验证集;
所述整合所述假图像数据集和新图像数据集,得到混合图像数据集,进一步包括:
当所述新图像数据集中包括过漏检图像数据时,将所述过漏检图像数据整合到所述假图像数据集的训练集中,形成所述混合图像数据集,其中,所述过漏检图像数据为所述旧目标检测模型识别图像数据集时产生的过捡和漏检的图像数据。
在一些实施例中,所述整合所述假图像数据集和新图像数据集,得到混合图像数据集,进一步包括:
当所述新图像数据集中的图像数据均不为过漏检图像数据时,按预设比例将所述新图像数据集分为训练集和验证集,所述过漏检图像数据为所述旧目标检测模型识别图像数据集时产生的过捡和漏检的图像数据;
将所述新图像数据集的训练集和验证集分别对应整合到所述假图像数据集的训练集和验证集中,得到所述混合图像数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市凌云视迅科技有限责任公司,未经深圳市凌云视迅科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211160029.7/2.html,转载请声明来源钻瓜专利网。