[发明专利]一种基于YOLOv5的无人机航拍图像目标检测方法在审
申请号: | 202211559260.3 | 申请日: | 2022-12-06 |
公开(公告)号: | CN116091946A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 周丽芳;王智峰;李伟生;肖明琪;王婧琳 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06V20/17 | 分类号: | G06V20/17;G06V10/24;G06V10/44;G06V10/762;G06V10/764;G06V10/82;G06V10/80;G06N3/0464;G06N3/045;G06N3/08 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolov5 无人机 航拍 图像 目标 检测 方法 | ||
1.一种基于YOLOv5的无人机航拍图像目标检测方法,其特征在于,包括以下步骤:
步骤1:将无人机图像数据集分为训练集和测试集,对训练集进行预处理以及数据增强,得到完备样本数据集并通过K-means算法聚类获取anchor锚框的尺寸大小;
步骤2:基于YOLOv5的主干网络,利用空洞卷积和可变形卷积,构建多样上下文提取模块对无人机图像进行特征提取和扩大感受野;
步骤3:在主干网络到Neck层之间,为了利用浅层的语义信息以及让网络关注到密集区域,构建串联交叉自注意力模块进行特征增强;
步骤4:通过完整的训练得到最终的模型,使用模型对测试图片进行检测,从而得到的检测结果。
2.根据权利要求1所述的一种基于YOLOv5的无人机航拍图像目标检测方法,其特征在于,所述步骤1对训练集进行预处理以及数据增强,得到完备样本数据集并通过K-means算法聚类获取anchor,具体包括以下步骤:
步骤1.1、对初始样本数据集中的图片通过缩放和拉伸生成1088*1088像素的图片,并且保持锚框比例;
步骤1.2、对步骤1.1中得到的图片数据进行数据增强,通过平移、旋转、调整饱和度和曝光度操作,增加样本数据,对待识别目标的特征参数进行处理;
步骤1.3、通过K-means聚类算法,对步骤1.2中得到的样本数据训练集所标注的待识别目标的真实目标边界框进行聚类分析;初始化9个anchor box,通过在所有的boundingboxes边界框中随机选取9个值作为anchor boxes的初始值;计算每个bounding box与每个anchor box的IoU交并比值,IoU的计算方式为:
其中∩表示交集,∪表示并集;
之后对于每个bounding box选取其最高的那个IoU值,然后求所有bounding box的平均值,也即最后的精确度值;最终得到9个精确的anchor box作为网络的预设值。
3.根据权利要求2所述的一种基于YOLOv5的无人机航拍图像目标检测方法,其特征在于,所述步骤2构建多种上下文提取模块对无人机图像进行特征提取,具体包括:
2.1在主干网络的SPP空间金字塔池化模块之后,先利用3组空洞卷积分别对原始特征图进行特征提取,其中空洞率分别设置为1,2,3;对得到的特征图进行Concat操作合并;
2.2对步骤2.1中得到的特征图继续使用可变形卷积去修正边界信息,具体做法是:额外建一个卷积层去学习偏置信息,利用偏移量去重新定位卷积位置;最后为了保证通道数相同,需要进行1x1卷积降维并做一个跳键连接进行特征融合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211559260.3/1.html,转载请声明来源钻瓜专利网。