[发明专利]基于双向注意力机制增强YOLO V5的目标检测方法在审
申请号: | 202111519608.1 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114282649A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 张媛;倪鹏;杨金龙;刘佳;朱志鑫 | 申请(专利权)人: | 江苏省特种设备安全监督检验研究院 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06V10/774;G06V10/80;G06V10/74 |
代理公司: | 无锡华源专利商标事务所(普通合伙) 32228 | 代理人: | 孙建 |
地址: | 210036 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双向 注意力 机制 增强 yolo v5 目标 检测 方法 | ||
本发明属于机器视觉领域,公开了基于双向注意力机制的YOLOV5的目标检测方法,将数据集按比例分为训练数据集和测试数据集;对训练数据集的图片归一化为固定大小的图片;将归一化后的图片先输入到增加输出层的骨干网络,再经过双向注意力机制模块后,在使用改进的损失函数计算的YOLOv5网络中训练和测试;将归一化后的实时数据图片输入到改进后的YOLOv5网络中,输出目标检测结果。本发明提高了对目标的检测能力,解决网络对特征差异不敏感的问题,解决训练过程目标框回归不稳定的问题,保证了anchor框和目标框之间的长宽比的一致性。
技术领域
本发明属于机器视觉、目标识别技术领域,尤其涉及基于双向注意力机制增强YOLO V5的目标检测方法。
背景技术
近年来,基于深度学习的目标检测算法在检测效果方面取得了很大的突破,同传统方法相比检测性能有着质的飞跃。深度学习目标检测算法根据设计思想的不同可以分成两大类,分别是一阶段方法(One-stage),与二阶段方法(Two-stage)算法,二阶段方法算法将检测过程分成两大部,首先生成待检测区域,然后基于此进行目标检测。随后出现的Fast-RCNN、Mask-RCNN与Faster-RCNN,使检测精度不断提高,但速度相对较慢。一阶段方法算法直接产生物体的类别概率和位置坐标,单次检测就得到最终的检测结果,典型的算法有YOLO、SSD、DSSD,性能最为突出的就是YOLO V5,其核心思想是将目标检测看做回归问题求解,通过图片的全部像素点直接得到检测框,检测速度快是其最大特点,缺点在于检测小目标物体时会出现漏检误检的问题,并不完全适用于小目标检测。
发明内容
有鉴于此,本发明提出了一种改进的基于双向注意力机制增强YOLO V5目标检测算法,通过改进算法的网络结构、加入双向注意力机制和浅层特征输出层,以及优化模型损失函数的方法,使改进后的算法更加适用于小目标检测。
针对网络结构加强对低层网络特征图的检测。一般来说,在卷积神经网络中生成的低层网络特征图主要用来反映待检测目标物体的细节特征,低层特征图主要用来检测小目标物体;而高层特征图主要反映的是抽象的语义信息,如轮廓、大体特征等,因此主要用来检测大目标物体。因此对于船舶相比较于海面的小物体更多的低层信息有利于目标的检测。因此在原网络结构的基础上额外引入这一层的输出特征图,并与上一个尺度中经过上采样的特征图进行拼接,增加一个输出尺度特征图用于小目标检测,提高对小目标的检测能力。
本发明公开的基于双向注意力机制增强YOLO V5的目标检测方法,所述方法应用于基于双向注意力机制增强YOLOv5网络,所述基于双向注意力机制增强YOLOv5网络在YOLOv5网络的骨干网络增加输出层和双向注意力机制模块,所述方法包括以下步骤:
将数据集按比例分为训练数据集和测试数据集;
对训练数据集的图片归一化为固定大小的图片,并输入到改进后的YOLOv5网络中;
将归一化后的图片先输入到增加输出层的骨干网络,再经过双向注意力机制模块后,在使用改进的损失函数计算的YOLOv5网络中训练和测试;
将归一化后的实时数据图片输入到改进后的YOLOv5网络中,输出目标检测结果。
进一步的,所述改进的损失函数如下:
其中:A为预测框,B为真实框;Actr为预测框中心点坐标,Bctr为真实框中心点坐标,ρ(.)是欧式距离计算;C为A、B最小包围框的对角线长度,IoU为交并比损失函数;
wgt和hgt分别表示真实框的宽和高;w和h分别表示预测框的宽和高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省特种设备安全监督检验研究院,未经江苏省特种设备安全监督检验研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111519608.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多轴一体型伺服电机驱动器
- 下一篇:污染事件的监测方法、装置及电子设备