[发明专利]一种基于改进YOLOv5的轻量化目标检测方法在审
申请号: | 202310097318.5 | 申请日: | 2023-02-10 |
公开(公告)号: | CN116110078A | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 王驭陌;刘祎;吴鹏 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/766;G06V10/82;G06V10/778;G06V10/774 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 汪清 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolov5 量化 目标 检测 方法 | ||
1.一种基于改进YOLOv5的轻量化目标检测方法,其特征在于,包括以下步骤:
步骤一:处理数据集,将数据集的train+val部分作为训练集,将数据集的test部分作为测试集;
步骤二:构建改进的YOLOv5网络模型;
步骤三:对步骤二得到的改进YOLOv5模型进行训练,在测试集上得到评价指标;
步骤四:将训练好的网络模型部署到嵌入式设备,输入待检测图像,训练好的网络模型将检测得到的目标用外接矩形框标记,并显示其类别。
2.根据权利要求1所述的基于改进YOLOv5的轻量化目标检测方法,其特征在于,所述步骤二具体包括以下步骤:
步骤1)设置不同压缩比的Ghostconv模块;
构建一条卷积核大小为1×1的卷积支路,输入通道数为上一层输出的通道数,输出通道数为该层总输出通道数除以压缩比值;
构建一条卷积核大小为5×5的卷积支路,输入通道数为该层总输出通道数除以压缩比值,输出通道数为总输出通道数减去另一条支路输出通道数,当压缩比值为2时group参数设为1,当压缩比值为4时group参数设为4;
将两条支路的输出进行拼接作为下一层的输入;
将模型中除第一层以外的Conv层替换为压缩比值为2的Ghostconv层与压缩比值为4的Ghostconv2层;
式(1)中c2为最终输出的通道数;cmi为进行一般卷积的通道数,nc为进行廉价卷积的通道数,ceil表示向上取整操作,ratio表示压缩比值;在原生网络的backbone和neck中分别采用ratio=2和ratio=4的比例进行传统卷积生成的特征图和廉价操作生成的特征图的拼接;
步骤2)将原生网络backbone的第四层设置为LCFI模块;
步骤3)将原生网络backbone的第九层和第十二层设置为坐标注意力机制模块;
步骤4)使用图像平移、缩放、翻转,图像HSV值增强方法进行数据增强。
3.根据权利要求2所述的基于改进YOLOv5的轻量化目标检测方法,其特征在于,所述步骤3)LCFI模块数学描述如下:
式(2)中F表示输入特征,convh和convv分别表示卷积核大小为1×k的水平卷积和卷积核大小为k×1的垂直卷积,表示批处理归一化和ReLU运算,Fc表示提取的大视野上下文特征。
4.根据权利要求2所述的基于改进YOLOv5的轻量化目标检测方法,其特征在于,坐标注意力机制模块数学描述如下:
其中,Oc(i,j)代表最终的输出,Ic(i,j)代表坐标信息嵌入处理后的输出,和分别代表两个方向上生成的协调注意力参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310097318.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低噪音变压器的制备方法
- 下一篇:密钥获取方法、装置、设备及存储介质