[发明专利]一种基于多尺度图像和加权融合损失的小目标检测方法有效
申请号: | 202010134062.7 | 申请日: | 2020-03-02 |
公开(公告)号: | CN111461110B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 林坤阳;罗家祥 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/766;G06V10/80;G06V10/82;G06V10/25;G06V10/26;G06N3/0464;G06N3/0475;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 林梅繁 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 图像 加权 融合 损失 目标 检测 方法 | ||
1.一种基于多尺度图像和加权融合损失的小目标检测方法,其特征在于,基于改进Mask RCNN模型实现,包括:
S1、搭建改进的Mask RCNN模型;所述改进的Mask RCNN模型包括:残差骨干网络、特征金字塔网络层、区域生成网络层、感兴趣框对齐层、分类器层、损失函数计算层和测试层;
S2、构建图像金字塔:对原始图像进行缩放处理,将原始图像、缩小尺寸后的图像、放大尺寸后图像一起构成图像金字塔;
S3、将图像金字塔中的图像进行随机裁剪;
S4、将随机裁剪后的图像送入残差骨干网络进行卷积、批归一化、池化操作,输出多组不同尺寸的特征图;
S5、将多组不同尺度的特征图进行融合,并进一步处理得到特征图P2-P6;
S6、对特征图P2-P6分别生成未筛选的候选检测框;
S7、将特征图P2-P6输入区域生成网络层,通过一系列卷积操作,得到候选检测框的偏移量以及置信度;
S8、把S7的候选检测框的偏移量与S6得到的未筛选的候选检测框数据结合,筛选出设定量的候选检测框作为感兴趣检测框;
S9、将感兴趣检测框分别对应回特征图P2-P6,并进行对齐操作;
S10、将对齐操作的结果输入到分类层,输出预测的感兴趣检测框类别得分、类别概率、坐标偏移量;
S11、将预测的感兴趣检测框类别得分、类别概率、坐标偏移量输入测试层,在测试层对类别概率取最大值进行筛选,选出感兴趣检测框对应的预测目标类别,进一步通过非极大值抑制过滤出多余的感兴趣检测框,最后在测试层得到最终预测的感兴趣检测框和对应的预测目标类别。
2.根据权利要求1所述的小目标检测方法,其特征在于,在训练阶段还包括:
S12、将S10中预测的感兴趣检测框类别得分输入损失函数计算层,与实际类别标签一起作为交叉熵函数的输入,用来计算分类损失值,得到特征图P2-P6的类别预测损失;
将S10中预测的感兴趣检测框坐标偏移量与真实目标框偏移量一起作为回归损失函数的输入,得到特征图P2-P6的回归预测损失;
S13、将特征图P2、特征图P3的类别预测损失分别进行加权,并与特征图P4、特征图P5、特征图P6的类别预测损失相加得到总的类别预测损失;
将特征图P2、特征图P3的回归预测损失分别进行加权,并与特征图P4、特征图P5、特征图P6的回归预测损失相加得到总的回归预测损失;
S14、通过反向传播对改进Mask RCNN模型参数、权重进行迭代更新,具体地,总的类别预测损失与总的回归预测损失分别被利用,进行优化迭代、更新改进Mask RCNN模型的权重值。
3.根据权利要求1所述的小目标检测方法,其特征在于,改进的Mask RCNN模型所作改进包括:
①、感兴趣检测框对齐不再统一对齐,而是分开对不同特征层进行对齐,对齐过后没有直接融合传入损失函数计算层,而是分别输入分类器层进行分别分类和回归,最终分开输入损失函数计算层,对检测小目标特征层计算出的损失函数进行加权,并与检测大、中目标层的损失函数融合;
②、在原有Mask RCNN模型中增加一层有效特征层P6;
③、去除原有Mask RCNN中图像分割模块,取消掩膜支路。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010134062.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序