[发明专利]基于改进YOLOv3的输电线缺陷多目标检测方法在审
申请号: | 202110600438.3 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113378672A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 韩恒;陈万培;张涛;高绅;杨钦榕 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T5/00;G06T5/40 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 陈栋智;董旭东 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 yolov3 输电线 缺陷 多目标 检测 方法 | ||
1.一种基于改进YOLOv3的输电线缺陷多目标检测方法,其特征在于,包括以下步骤:
步骤一:数据集图像筛选,获取的原始图片进行有目的的筛检,图片至少包含导地线、防震锤、鸟巢、标识牌、导地线线夹和间隔棒六类之一,初步选择符合要求的目标图片;
步骤二:对步骤一得到的图片进行图像增广,将筛选后的图片使用数据增广方式进行处理,包括平移、旋转、翻转、缩放裁剪和旋转平移组合变换,在处理过程中随机选择平移的距离和旋转的角度,得到目标数据集;
步骤三:步骤二完成数据增广后需要对目标数据集的部分照片进行图像预处理操作,使用分段线性变换灰度变换方法、直方图均衡化方法、同态滤波方法以及平滑去噪方法对图像进行处理;
步骤四:对步骤三预处理过的目标数据集进行整理与标注,批量修改图片名称,批量化标注目标数据集;
步骤五:将特征注意力机制和融合两者“结合”对YOLOv3进行改进,得到改进后的算法;
步骤六:使用前面标注好的目标数据集在改进后的算法中进行训练,训练完成对待检测图片进行检测。
2.根据权利要求1所述的基于改进YOLOv3的输电线缺陷多目标检测方法,其特征在于,步骤五中算法改进具体包括:
注意力机制-融合对于任何给定的变换,将输入特征图X1和X2分别经过1×1卷积,得到T1和T2,其中,为尺度空间表示一个空间结构,H代表特征图的高度,W代表特征图的宽度,C1及C2表示通道数;
将T1,T2特征传递给最大平均池化操作,将其特征压缩到H×W空间维度上,此时的特征变成某种意义上具有全局的感受野的向量,同时输出的维度与输入的特征通道数相匹配,如以下两个公式:
其中
接着进行一个全连接层操作,使用卷积核大小为1×1,步长为1的卷积代替传统意义上的全连接操作,经过全连接操作后,得到S1,S2;
将S1,S2相加得到P,此时通道维度上原始特征重聚合,如公式所示:
P=S1+S2#(4.19)
其中
P经过Sigmoid函数,输出的权重视为每个融合特征通道的重要性,再经过矩阵运算把每个通道加权到X1和X2特征上,实现在通道维度上的对原始特征的重标定融合,得到新的特征Y;过程如下公式:
Y=(X1+X2)*Sigmoid(P)。
3.根据权利要求1所述的基于改进YOLOv3的输电线缺陷多目标检测方法,其特征在于,步骤六中在训练的过程中使用余弦学习率和同步归一化技术进行处理;
余弦学习率处理具体为:
使用梯度下降算法优化目标函数时,使用余弦函数来配合降低学习率,学习率随迭代次数的变化规律如以下两个公式所示:
其中ηmin,ηmax表示为学习率的范围,Tcur表示为当前执行了多少个epoch,Tmax表示为总的epoch数;训练过程中再做出如下修改:
在实际训练时,当轮到相应的epoch时,重置优化器的TotalIeration和初始化Tcur即可。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110600438.3/1.html,转载请声明来源钻瓜专利网。