[发明专利]基于元学习和跨阶段沙漏的大视场小样本目标检测方法有效
申请号: | 202110487663.0 | 申请日: | 2021-05-06 |
公开(公告)号: | CN113221993B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 李文涛;李良伟;黑永强;李世玉;郇金晓 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 阶段 沙漏 视场 样本 目标 检测 方法 | ||
1.一种基于元学习和跨阶段沙漏的大视场小样本目标检测方法,其特征在于,包括如下步骤:
(1)构建第一训练样本集、第二训练样本集和测试样本集:
(1a)从大视场图像数据库中选取包括C个目标类别的M幅尺寸为H×W的图像T={Tm|1≤m≤M},并对每幅图像Tm中的目标进行标注,得到T对应的标签集合G={Gm|1≤m≤M},其中,C≥4,M≥200,Tm表示第m幅图像,Gm表示Tm对应的标签;
(1b)按照先行后列的顺序,并以大小为SH×SW的滑窗将每幅图像Tm裁剪成N个图像块,得到图像块集合T′={T′m|1≤m≤M}和标签块集合G′={G′m|1≤m≤M},其中T′m表示Tm对应的图像块子集合,T′m={T′mn|1≤m≤M,1≤n≤N},T′mn表示T′m中的第n个图像块,G′m表示T′m对应的标签块子集,G′m={G′mn|1≤m≤M,1≤n≤N},G′mn表示T′mn对应的标签,
(1c)筛选出标签块集合G′中交并比大于阈值的标签G′mn,得到筛选标签块集合G″={G″m|1≤m≤M};
(1d)将图像块集合T′中的C1个目标类别的M1幅图像及其对应的筛选标签作为第一训练样本集,并剩余的C2个目标类别的M2幅图像及其对应的筛选标签中的一半作为第二训练样本集,另一半作为测试样本集,其中,M1≥5×M2,M1+M2=M,C1+C2=C;
(2)构建基于跨阶段沙漏结构的一阶段目标检测模型H1:
构建包括级联的特征提取器fextractor、特征解码器fdecoder和第一类别生成器fclass1的一阶段目标检测模型H1,其中,fextractor包括交叉层叠的多个下采样层和多个跨阶段沙漏层;fdecoder包括顺次连接的多个上采样层;fclass1包括3个并行分布的卷积层,第一卷积层的激活函数为Sigmoid,输出通道数与图像块集合T′中的目标类别个数C1相同,第二卷积层和第三卷积层的激活函数均为ReLU,输出通道数均为2;
(3)对基于跨阶段沙漏结构的一阶段目标检测模型H1进行迭代预训练:
(3a)初始化迭代次数为e,最大迭代次数为E,E≥120,学习率为l=1.25×10-4,并令e=1;
(3b)从第一训练样本集有回放的随机选取的B个训练样本,并对每个训练样本的标签分别进行热力图转化、宽高矩阵转化和偏移矩阵转化,得到带有热力图标签、宽高矩阵标签和偏移矩阵标签的B个标签转化后的训练样本,8≤B≤32;
(3c)将B个标签转化后的训练样本作为一阶段目标检测模型H1的输入,特征提取器fextractor对每个训练样本的图像进行特征提取,特征解码器fdecoder对所提取每个特征进行解码,类别生成器fclass1中的第一卷积层对每个解码结果进行热力图变换,第二卷积层对每个解码结果进行宽高矩阵变换,第三卷积层对每个解码结果进行偏移矩阵变换,得到B个预测热力图、B个预测宽高矩阵和B个预测偏移矩阵;
(3d)采用Focal Loss损失函数,并通过B个热力图标签和B个预测热力图计算B个训练样本的热力图损失值Lheatmap,同时采用L1损失函数,并通过B个宽高矩阵标签和B个预测宽高矩阵,以及B个偏移矩阵标签和B个预测偏移矩阵,计算B个训练样本的宽高损失值Lsize以及偏移损失值Loff,然后对Lheatmap、Lsize和Loff进行加权求和,得到训练样本的损失值L;
(3e)采用反向传播方法,并通过损失值L计算一阶段目标检测模型H1的权重参数梯度F,再采用Adam优化算法,并通过F和学习率l对一阶段目标检测模型H1的权重参数进行更新;
(3f)判断e>E是否成立,若是,得到训练好的一阶段目标检测模型H′1,否则,令e=e+1,并执行步骤(3b);
(4)构建基于跨阶段沙漏结构的二阶段目标检测模型H2:
构建包括训练好的一阶段目标检测模型H′1中的特征提取器f′extractor和特征解码器f′decoder,以及第二类别生成器fclass2的基于跨阶段沙漏结构的二阶段目标检测模型H2,f′extractor、f′decoder和fclass2依次级联;
(5)基于元学习的方法对基于跨阶段沙漏结构的二阶段目标检测模型H2进行迭代训练:
(5a)初始化迭代次数为a,最大迭代次数为A,A≥2000,元学习率为r1=1.25×10-4,并令a=1;
(5b)初始化元学习的子任务迭代次数为v,元学习的最大迭代子任务数V,总任务损失为LV,并令v=1,LV=0,其中,2≤V≤10;
(5c)从第二训练样本集中随机选取包括c个目标类别的k个训练样本,并对每个训练样本的标签分别进行热力图转化、宽高矩阵转化和偏移矩阵转化,得到每个训练样本带有热力图标签、宽高矩阵标签和偏移矩阵标签的标签转化后的c×k训练样本,然后从c×k训练样本随机选取c×kspt个作为支持集,选取c×kqry个训练样本作为查询集,其中,1≤c≤C2,k≥15,1≤kspt≤5,5≤kqry≤10;
(5d)将支持集作为二阶段目标检测模型H2的输入,特征提取器f′extractor对每个图像块进行特征提取,特征解码器f′decoder对所提取每个特征进行解码,类别生成器fclass2中的第一卷积层对每个解码结果进行热力图变换,第二卷积层对每个解码结果进行宽高矩阵变换,第三卷积层对每个解码结果进行偏移矩阵变换,得到c×kspt个预测热力图、c×kspt个预测宽高矩阵和c×kspt个预测偏移矩阵;
(5e)采用Focal Loss损失函数,并通过c×kspt个预测热力图及其对应的标签计算支持集的热力图损失值L′heatmap,同时采用L1损失函数,并通过c×kspt个预测宽高矩阵及其对应的标签,以及c×kspt个预测偏移矩阵及其对应的标签,计算支持集的宽高损失值L′size以及偏移损失值L′off,然后对L′heatmap、L′size和L′off进行加权求和,得到支持集的损失值L′;
(5f)采用反向传播方法,并通过支持集的损失值L′计算二阶段目标检测模型H2的权重参数梯度F′,再采用Adam优化算法,并通过F′和学习率r2=3×10-4对二阶段目标检测模型H2权重参数进行更新,得到权重参数更新后的二阶段目标检测模型
(5g)将查询集作为权重参数更新后的二阶段目标检测模型的输入,中的特征提取器对每个图像块进行特征提取,特征解码器对所提取每个特征进行解码,类别生成器中的第一卷积层对每个解码结果进行热力图变换,第二卷积层对每个解码结果进行宽高矩阵变换,第三卷积层对每个解码结果进行偏移矩阵变换,得到c×kqry个预测热力图、c×kqry个预测宽高矩阵和c×kqry个预测偏移矩阵;
(5h)采用Focal Loss损失函数,并通过c×kqry个预测热力图及其对应的标签计算查询集的热力图损失值L″heatmap,同时采用L1损失函数,并通过c×kqry个预测宽高矩阵及其对应的标签,以及c×kqry个预测偏移矩阵及其对应的标签,计算查询集的宽高损失值L″size以及偏移损失值L″off,然后对L″heatmap、L″size和L″off进行加权求和,得到查询集的损失值L″;
(5i)令令LV=LV+L″,并判断v>V是否成立,若是,执行步骤(5j),否则,令v=v+1,并执行步骤(5c);
(5j)采用反向传播方法,并通过平均任务损失L′V=LV/V计算二阶段目标检测模型H2的权重参数梯度F″,再采用Adam优化算法,并通过F″和元学习率r1对二阶段模型参数H2进行更新;
(5k)判断a>A是否成立,若是,得到训练好的二阶段目标检测模型H′2,否则,令a=a+1,并执行步骤(5b);
(6)获取目标检测结果:
(6a)将测试样本集作为训练好的二阶段目标检测模型H′2的输入进行前向传播,得到个预测热力图、预测宽高矩阵以及预测偏移矩阵;
(6b)通过所提取的每个测试样本的预测热力图、预测宽高矩阵以及预测偏移矩阵的目标检测信息,计算每个目标检测框的位置,得到个目标检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110487663.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:深度时序N-SEIR传染病预测模型
- 下一篇:零信任下的网络资源访问控制方法