[发明专利]基于多目标检测模型无标签的知识蒸馏方法及存储介质在审
申请号: | 202110838933.8 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113610126A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 卢涛;顾宇;张彦铎;吴云韬 | 申请(专利权)人: | 武汉工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 黄帅 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多目标 检测 模型 标签 知识 蒸馏 方法 存储 介质 | ||
本发明公开了一种基于多目标检测模型无标签的知识蒸馏方法及存储介质,属于计算机视觉目标检测领域,该方法包括以下步骤:S1、获取多类别数据集;S2、利用不同类别的数据集训练出不同的教师网络,将无标签的图片输入至学生网络和多个教师网络,引导学生网络训练;学生网络的类别为多个教师网络类别的组合;S3、设计全局蒸馏损失以及自适应损失,平衡多个不同教师网络和学生网络之间的蒸馏损失,平衡不同教师网络之间的语言特性,优化学生网络训练过程。本发明能够有效提炼出不同教师网络中的多类别信息,进行完整类别的目标检测,并且在单一数据集的制定类别上与教师网络持平甚至超越。
技术领域
本发明属于计算机视觉目标检测领域,具体涉及一种基于多目标检测模型无标签的知识蒸馏方法及存储介质。
背景技术
在人工智能发展迅速的今天,目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域,通过计算机视觉减少对人力资本的消耗,具有重要的现实意义。因此,目标检测也就成为了近年来理论和应用的研究热点,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分,同时目标检测也是泛身份识别领域的一个基础性的算法,对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。得益于深度学习CNN网络架构的发展,目标检测任务的性能逐步提高。然而,现有的目标检测框架针对完全标注的监督学习模式设计,对于半标注和无标注的数据集,现有框架难以抽取出数据集中有效地信息并加以训练。目标检测任务在实际应用中存在目标域变换或目标类别变化,并且对模型大小和推理速度都有更加苛刻的要求。针对这一问题,基于知识蒸馏的目标检测被证实为一种行之有效的方案。
知识蒸馏(Knowledge distillation,KD)于2015年提出,被广泛应用于迁移学习和模型压缩中,知识蒸馏可以将一个或多个网络的知识转移到另一个同构或者异构的网络。知识蒸馏需要先训练一个或多个教师网络,然后使用这些教师网络的输出和数据的真实标签联合训练学生网络。知识蒸馏可以用于将网络从大的教师网络转化成一个小的学生网络,实现模型的压缩并保留接近于大网络的性能;也可以将多个教师网络的知识转移到一个学生网络中,使得单个网络的性能接近emsemble的结果。
现阶段大多数基于知识蒸馏的目标检测方法大多在单一数据集上展开,从大的教师网络中指导小的学生网络训练,用以获取挖掘学生模型性能,但是很少有跨数据集和类别的目标检测网络蒸馏研究。
实际场景中有很多类似的需求,往往需要同时检测出多个关注的类别。然而现有的开源数据大多针对通用场景下构建数据集,大多包含其中的一个类别或者多个类别,并不能包含关注的所有类别,因此要获得一个能够检测实际场景中的所有类别是一项研究的难点。假设A数据集中包含物体{a1,a2,…,an}类别但不包含{b1,b2,…bn}类别,B数据集中包含{b1,b2,…bn}等类别但不包含{a1,a2,…,an}类别,然而实际场景需要{a1,a2,…,an,b1,b2,…bn}检测所有类别的模型,如何更好地使用现有数据集获取检测完整类别的目标检测网络是一个重要的需求和难点。
发明内容
本发明的目的在于,提供一种基于多目标检测模型无标签的知识蒸馏方法及存储介质,获取检测完整类别的目标检测网络,实现跨数据集和跨类别的目标检测。
本发明提供的技术方案如下:
一种基于多目标检测模型无标签的知识蒸馏方法,包括以下步骤:
S1、获取多类别数据集;
S2、先利用不同类别的数据集训练出不同的教师网络模型,而后将无标签的图片输入至学生网络和多个教师网络模型,从而使教师网络模型引导学生网络训练;其中,学生网络的类别为多个教师网络类别的组合;
S3、设计全局蒸馏损失以及自适应损失,平衡多个不同教师网络和学生网络之间的蒸馏损失,平衡不同教师网络之间的语言特性,优化学生网络训练过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉工程大学,未经武汉工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110838933.8/2.html,转载请声明来源钻瓜专利网。