[发明专利]一种基于增量学习的目标检测方法在审
申请号: | 202110717472.9 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113536971A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 陈扬;张杰;杨宵玲;杜寅超;陈江鹏;郑学哲 | 申请(专利权)人: | 中科苏州智能计算技术研究院;苏州旭创科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 陈忠辉 |
地址: | 215123 江苏省苏州市苏州工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 增量 学习 目标 检测 方法 | ||
本发明揭示了一种基于增量学习的目标检测方法,在不改变原有目标检测网络的检测能力基础上,能持续增加新的检测功能,主要概述步骤为构建目标检测网络,在目标检测网络的图像分类特征层添加图像重构误差模块,基于图像信息重构的方式,提取到得到抽象、完备的特征;设计了赋予图像中低频和高频分量不同权重的重构损失函数,避免网络在重构的图像中丢失目标特征;在目标检测网络的完备特征空间中,插入ICLM模块进行类别增量学习任务。应用本发明目标检测方法,在通用的目标检测网络中构建的完备特征空间能有效地保留整张图像的信息,避免在特征提取阶段产生特征丢失,是一种简单有效的增量学习方法。
技术领域
本发明涉及一种深度网络模型的增量学习领域,尤其涉及一种基于增量学习的目标检测方法。
背景技术
目标检测算法在现实生活中已经有广泛的应用,在特定场景中,目标检测算法的准确率也逐渐提升至快饱和的状态。然而,现实生活中,随着新需求的提出和产品的种类增加,目标检测算法需要判断的类别也随之增加。若重新建立一个新的神经网络模型,或在一个已有的目标检测模型中添加新的可检测类别,并使用新类别的数据集直接训练已有网络,则训练出的模型会很大程度地丧失在旧类别上的检测能力。基于此,研究人员提出了增量学习,使得一个学习器从新数据中获得新知识的同时,能够保留从之前数据中已经学习得到的旧知识。
目前已有的增量学习方法可分为两类:一种是基于模型蒸馏的思想,通过设计保留损失函数,使得在旧类任务中新网络的输出与原有网络的输出近似;通过新任务检测损失函数,使得网络在新的类别数据中有效检测。通过设计这种损失函数并微调整体网络,可以将旧类的检测能力大部分保存。这种方法改变了原先相关任务的参数,在原先类别的分类能力上会有变化,但在新的类别任务中精度较高。另一种是基于特征提取的思想,将网络前部的层作为一个通用的特征提取器,在检测新的类别时,对已有的网络添加新的输出层。在训练阶段,使用新类别数据训练新添加的输出层参数,使得新的模型能够有效检测新增类别任务。这种方法没有改变原先类的参数,因此原先类的分类能力被完备保存,但在新的类别任务中精度不高。
发明内容
鉴于上述现有技术的不足,本发明的目的旨在提出一种基于增量学习的目标检测方法,提升算法在新增的类别任务中的检测精度。
本发明实现上述目的的技术解决方案是:一种基于增量学习的目标检测方法,其特征在于:S1、使用原始数据集,并对其中的图像数据进行预处理,将图像调整到预期目标检测网络设定的尺寸;S2、构建目标检测网络,并在目标检测网络的图像分类特征层添加图像重构误差模块,基于图像重构提取得到抽象、完备的图像特征;S3、综合图像重构和原有目标检测网络的损失函数,对目标检测网络进行训练优化,使图像重构损失函数和目标检测网络损失函数达到收敛,并保存优化后网络的权重参数;S4、使用新的任务数据集,并对其中的图像数据进行预处理,将图像调整到网络设定的尺寸;S5、构建基于类增量目标检测网络的新的网络模型,并在网络的特征空间添加增量学习模块;S6、在新的网络模型中加载步骤S3所得的权重参数,并随机初始化增量学习模块的参数;S7、使用新的任务数据集只训练增量学习模块的分类网络与回归网络,并使分类与回归的损失函数达到收敛,并保存增量目标检测网络的权重参数;S8、部署优化后的参数,对目标进行检测;S9、增加新的类别任务,重复执行步骤S4~S8。
应用本发明目标检测新的技术解决方案具备显著的进步性:该方法通过设计赋予图像中低频和高频分量不同权重的图像重构损失函数,构建了一个包含各类别任务丰富的相关特征、相对更完备的特征空间,从而提高算法在新增的类别任务中的检测精度。
附图说明
图1为本发明方法中一种基于完备特征空间的Yolo v4增量学习网络框架示意图。
图2为本发明方法中一种基于完备特征空间的Yolo v4增量学习网络模块图。
图3为本发明方法中一种基于完备特征空间的Faster RCNN增量学习网络框架示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科苏州智能计算技术研究院;苏州旭创科技有限公司,未经中科苏州智能计算技术研究院;苏州旭创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110717472.9/2.html,转载请声明来源钻瓜专利网。