[发明专利]一种基于深度学习的红外运动目标识别方法在审

申请号：	202210194141.6	申请日：	2022-03-01
公开（公告）号：	CN114612509A	公开（公告）日：	2022-06-10
发明（设计）人：	刘聆;彭波;刘冬云	申请（专利权）人：	长沙一扬电子科技有限公司
主分类号：	G06T7/246	分类号：	G06T7/246;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司：	长沙大珂知识产权代理事务所(普通合伙) 43236	代理人：	伍志祥
地址：	410008 湖南省长沙市开福区芙蓉北路街***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习红外运动目标识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于深度学习的红外运动目标识别方法，在Yolo V4骨架网络的每一个残差块中加入注意力模块，三个预测分支中，每个预测分支的最后一个卷积层之前也加入注意力模块；对于输出的特征图，每一幅都在空间维度上进行全局平均池化和最大池化，结果分别输入权值共享的三层全连接网络，得到一维的通道注意力；对于卷积层的输出，在通道维度上进行最大池化和平均池化，将两者在通道维度上相连，输入卷积层，结果经过损失函数，得到单通道的二维空间注意力；通道注意力和空间注意力先后与特征图相乘，得到优化后的特征图。本发明在卷积神经网络中加入了注意力模块，有效增强网络对有效特征的敏感度，方便嵌入已有网络。

技术领域

本发明属于目标识别技术领域，尤其涉及一种基于深度学习的红外运动目标识别方法。

背景技术

对于红外运动目标的检测，由于被检测目标存在的场景遮挡、距离远近及一些非刚性形变而加大识别的复杂性，而且红外图像中物体的纹理细节单一、边缘模糊，更是增加了预测的难度。

发明内容

本发明提出一种基于深度学习的红外运动目标识别方法，该方法通过骨架网络的残差块和Yolo层中的引入注意力模块，可以提高识别精度。本发明基于深度学习对红外场景进行目标检测，通过对深度学习目标检测分类算法YoLo v4算法进行优化和改进，可以有效的对红外运动目标进行准确识别。

本发明公开的基于深度学习的红外运动目标识别方法，包括以下步骤：

在Yolo V4骨架网络的每一个残差块中加入注意力模块，三个预测分支中，每个预测分支的最后一个卷积层之前也加入注意力模块；

对于输出的特征图，每一幅都在空间维度上进行全局平均池化和最大池化，结果分别输入权值共享的三层全连接网络，进行维度变化，输出结果相加，再经过sigmoid函数后得到一维的通道注意力；

对于卷积层的输出，在通道维度上进行最大池化和平均池化，得到二维的中间结果，将两者在通道维度上相连，输入卷积层，结果经过损失函数，得到单通道的二维空间注意力；

通道注意力和空间注意力先后与特征图相乘，得到优化后的特征图；

将优化后的特征图进行识别，得到识别结果。

进一步的，所述得到一维的通道注意力的数学表达如下：

Z_avg＝avg(U)

Z_max＝max(U)

S_c＝σ(fc₂(δ(fc₁(Z_avg)))+fc₂(δ(fc₁(Z_max))))

式中，avg(·)表示全局平均池化，max(·)表示全局最大池化，fc₁(·)表示维度c→c/r的全连接层，σ(·)表示ReLU函数，fc₂(·)表示维度c/r→c的全连接层，σ(·)表示sigmoid函数，U为特征图。

进一步的，所述得到单通道的二维空间注意力的数学表达如下：

Z_AVG＝AVG(U)

Z_MAX＝MAX(U)

S_s＝σ(conv_2，1，k(Z_AVG；Z_MAX))

式中，AVG(·)表示通道维度上的平均池化，MAX(·)表示通道维度上的最大池化，conv_2，1，k表示输入通道数为2，输出通道数为1，卷积核尺寸为k的卷积层，σ(·)表示sigmoid函数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于长沙一扬电子科技有限公司，未经长沙一扬电子科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210194141.6/2.html，转载请声明来源钻瓜专利网。

上一篇：一种EVA拖鞋制作加工装置及制作加工方法
下一篇：一种PCR板单模可切换式生产模具及生产工艺

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习的红外运动目标识别方法在审

专利文献下载