[发明专利]一种基于域自适应学习的多复杂场景目标检测方法在审
申请号: | 202011278312.0 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112434586A | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 苏卓;汤成熙;周凡;林格 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 学习 复杂 场景 目标 检测 方法 | ||
1.一种基于域自适应学习的多复杂场景目标检测方法,其特征在于,所述方法包括:
收集通用目标检测图像数据,以及多种降质场景下的图像数据,并对数据进行预处理,得到通用目标检测图像集、降质场景图像集;
利用所述通用目标检测图像集预训练目标检测网络YOLOv3;
在所述预训练完成的目标检测网络YOLOv3的基础上嵌入域自适应模块,并利用所述通用目标检测图像集、所述降质场景图像集对嵌入了域自适应模块的目标检测网络重新进行训练,训练完成后,再把该域自适应模块进行拆除,得到最终的多复杂场景目标检测网络;
输入待检测目标的图像,通过所述多复杂场景目标检测网络计算得出图像中特定物体的类别以及位置信息。
2.如权利要求1所述的一种基于域自适应学习的多复杂场景目标检测方法,其特征在于,所述通用目标检测图像数据,具体为:
通用目标检测图像数据包含良好环境下的图像数据以及对应的标注数据,即,在图像上,每一个可识别的物体为一个实例,每个实例对应的标注信息包括:该实例的类别,以及包围该实例的最小矩阵位置信息。
3.如权利要求1所述的一种基于域自适应学习的多复杂场景目标检测方法,其特征在于,所述多种降质场景下的图像数据,具体为:
多种降质场景下的图像数据包含了雨、雾、低光三种不同场景的数据集,其只包含有图像数据,而不需要含有目标检测任务相关的位置信息标注。
4.如权利要求1所述的一种基于域自适应学习的多复杂场景目标检测方法,其特征在于,所述嵌入域自适应模块,具体为:
在所述目标检测网络YOLOv3的基础上,在8倍下采样、16倍下采样和32倍下采样得到的特征图后面,分别串联增加域自适应模块,该域自适应模块的结构包括梯度反转层、卷积层、softmax操作和域分类器;
所述梯度反转层在网络训练正向传播过程中传递的是正值,而在反向传播的过程中传播的是负值,该层的作用是将域自适应模块的损失最大化;
所述卷积层和所述softmax操作将特征图映射到一个1*4的特征向量,表示该特征图属于某个域的类别概率。
5.如权利要求1所述的一种基于域自适应学习的多复杂场景目标检测方法,其特征在于,所述利用所述通用目标检测图像集、所述降质场景图像集对嵌入了域自适应模块的目标检测网络重新进行训练,具体为:
按照不同场景对所述通用目标检测图像集、所述降质场景图像集的图像数据加上域标注,其中所述通用目标检测图像的域标注为0,所述降质场景图像中雨的域标注为1,雾的域标注为2,低光的域标注为3;
训练时,需要同时将所述通用目标检测图像集、所述降质场景图像集中的图像数据以及图像所包含的域标注输入到嵌入了域自适应模块的目标检测网络中,如果图像数据的域标注不为0,则只需要通过域自适应模块,计算域分类损失,并将损失的梯度回传,更新网络的参数;
如果数据的域标注为0,则不仅要通过域自适应模块,也要通过整个目标检测网络,同时计算域分类损失以及检测损失,并将损失的梯度回传,更新网络的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011278312.0/1.html,转载请声明来源钻瓜专利网。