[发明专利]一种基于注意力机制的港口环境下目标检测方法、系统、终端及可读存储介质有效
申请号: | 202110115168.7 | 申请日: | 2021-01-28 |
公开(公告)号: | CN113158738B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 唐琎;汤松林;吴志虎;李思蓝 | 申请(专利权)人: | 中南大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/25;G06V10/40;G06V10/762;G06V10/764;G06V10/82;G06N3/04;G06N3/08;G06T5/30;G06T7/155;G06T7/194;G06T11/40 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 姚瑶 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 港口 环境 目标 检测 方法 系统 终端 可读 存储 介质 | ||
1.一种基于注意力机制的港口环境下目标检测方法,其特征在于:包括如下步骤:
步骤S1:采集港口环境下轮胎吊作业监控范围内的图像数据,利用图像数据中的含检测目标的图像构建样本集;
步骤S2:将样本集进行K-means聚类以获取k个先验瞄框Prior Anchor;
步骤S3:对样本集中的图像进行预处理,并输入基于注意力机制的yolov3目标检测模型进行训练,得到港口环境下的目标检测模型;
其中,在所述yolov3目标检测模型中的FPN网络架构中增设通道及空间注意力模块CA-SAM,所述通道及空间注意力模块CA-SAM包括通道注意力子模块和空间注意力子模块,分别表示为CA子模块和SA子模块;
所述CA子模块中对输入的特征图Fc分别进行最大池化MaxPool、平均池化AvgPool以及将MaxPool与AvgPool的结果进行通道拼接Concat操作,再输入至共享参数的MLP网络,再将所述MLP网络的通道输出结果相加形成通道注意力Mc特征图,然后将输入特征图Fc与所述通道注意力Mc特征图进行点乘输出的全局最大化与全局平均化的特征图Fc';
所述SA子模块对全局最大化与全局平均化的特征图Fc'进行不同的卷积操作;所述目标检测模型的输入参数为预处理后的图像,输出结果包括对应图像的预测框中是否存在检测目标;
所述SA子模块的实现过程如下:
对特征图Fc'进行MaxPool以及AvgPool操作并将MaxPool以及AvgPool操作后的2个特征图进行Concat操作,对Concat操作后的特征图分别进行若干个不同大小卷积并再次进行Concat操作,然后再进行1×1的卷积得到空间注意力特征图Ms,最后将空间注意力特征图Ms与特征图Fc'进行点乘得到输出特征图Fs;
在所述yolov3目标检测模型中的特征金字塔FPN网络架构中设有前景背景分割模块,表示为FBM模块;
其中,所述FBM模块设置在所述空间注意力模块CA-SAM之后,所述FBM模块对所述空间注意力模块CA-SAM输出的特征图Fs分别进行不同膨胀率的膨胀卷积,再进行Concat操作得到特征图,并利用softmax函数从所述特征图中提取前景特征图,然后将所述前景特征图的维度扩展到与特征图Fs相同,再将其与特征图Fs进行点乘得到特征图Ds;
步骤S4:利用所述港口环境下目标检测模型进行目标检测。
2.根据权利要求1所述的方法,其特征在于:所述yolov3目标检测模型中的FPN网络架构的最终检测分支上设有RFB模块,所述RFB模块利用不同的普通卷积以及不同膨胀卷积对输入的特征图进行操作,并将操作后的多组特征图进行Concat操作,再将Concat操作后的特征图进行1×1卷积得到所述yolov3目标检测模型输出的最终的特征图。
3.根据权利要求2所述的方法,其特征在于:所述RFB模块的实现过程如下:
对输入的特征图分别进行1×1普通卷积和3*3大小且膨胀率为1的膨胀卷积、3×3普通卷积和3×3大小且膨胀率为3的膨胀卷积、5×5的普通卷积和3×3大小且膨胀率为5的膨胀卷积,然后,将以上三组卷积的特征图进行Concat操作;且将Concat操作后的特征图进行1×1卷积得到最终的特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110115168.7/1.html,转载请声明来源钻瓜专利网。