[发明专利]基于尺度上下文的变电站图像目标检测方法在审

专利信息
申请号: 202210397810.X 申请日: 2022-04-15
公开(公告)号: CN114882208A 公开(公告)日: 2022-08-09
发明(设计)人: 徐波;李福德;李志坤;钟成;夏祥波;林谋 申请(专利权)人: 国网江西省电力有限公司超高压分公司;国家电网有限公司;珠高智能科技(深圳)有限公司
主分类号: G06V10/24 分类号: G06V10/24;G06V10/20;G06V10/774;G06V10/25;G06V10/762;G06K9/62;G06V10/80;G06V10/82;G06V10/44;G06V10/764;G06V10/766;G06N3/04;G06N3/08
代理公司: 南昌丰择知识产权代理事务所(普通合伙) 36137 代理人: 吴称生
地址: 330000 江西省南昌*** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 尺度 上下文 变电站 图像 目标 检测 方法
【权利要求书】:

1.一种基于尺度上下文的变电站图像目标检测方法,其特征是,包括以下步骤:

步骤一、数据预处理:采用基于仿射变换的数据增强和随机增强策略完成数据集扩充,得到数据增强后的训练集;

步骤二、特征提取:采用经过预训练的VGG-16模型作为特征提取网络,每张输入图像在一系列卷积及池化后,得到不同尺寸的卷积特征图;

步骤三、提取感兴趣区域:使用区域提名网络进行候选框提取,得到感兴趣区域;区域提名网络首先对特征提取网络的最后一层卷积特征图进行滑窗操作,在每个窗口的中心位置生成一系列锚框;利用基于K-means的锚框尺度制定策略,通过对训练集标注文件中矩形包围框的长、宽进行于K-means聚类得到数据分布,从而调整锚框尺度;

步骤四、多尺度特征融合:将感兴趣区域映射到特征提取网络的卷积特征图上,并对其对应区域进行感兴趣区域池化,再通过两层全连接层,输出融合特征;

步骤五、分类和定位:对输出的融合特征进行分类和定位,在分类时,采用Soft-NMS算法去除冗余框。

2.根据权利要求1所述的基于尺度上下文的变电站图像目标检测方法,其特征是,所述VGG-16模型包括6层卷积池化层,依次为:Conv1_3层、Conv2_3层、Conv3_3、Conv4_3层、Conv5_3层、Conv6_3层,输入图像在进行6组卷积、池化操作后,得到不同尺寸的卷积特征图。

3.根据权利要求2所述的基于尺度上下文的变电站图像目标检测方法,其特征是,步骤三中,在Conv5_3输出的卷积特征图上,利用区域提名网络进行候选框提取,得到感兴趣区域,通过感兴趣区域池化层将感兴趣区域坐标分别映射到不同层级的卷积特征图上,得到对应区域的RoI映射卷积特征图。

4.根据权利要求3所述的基于尺度上下文的变电站图像目标检测方法,其特征是,步骤四中,将Conv4_3层和Conv5_3层的RoI映射卷积特征图分别作为第一全连接层的输入,进行一次全连接操作,得到两个1×1×2048的特征向量,然后拼接成为一个1×1×4096的融合特征,再经过第二全连接层,输出到分类回归网络进行最终的分类和定位。

5.根据权利要求4所述的基于尺度上下文的变电站图像目标检测方法,其特征是,步骤五中,Soft-NMS算法的重评分过程用一个连续的罚函数来表达,在预测框不重叠的情况下不惩罚,在高重叠情况下有很高的惩罚,将置信度构建为关于交并比的函数:

其中,si表示当前预测框的置信度评分,IoU(B,bi)表示预测框bi与评分最大框B的面积交并比,P表示最终预测框的集合,e为自然对数,σ为罚函数系数。

6.根据权利要求1所述的基于尺度上下文的变电站图像目标检测方法,其特征是,步骤一中,采用的主要仿射变换方式包括:缩放、旋转、翻转、平移、尺度变换以及插值;为了扩大设备矩形包围框尺寸的范围,将图像随机缩放至原图尺寸的80%到120%之间;为了增加设备矩形包围框高宽比的丰富性,对图像进行±30°范围以内的随机旋转;另外,对随机50%的图像进行镜像翻转;对随机20%的图像进行垂直翻转;在原图像宽度的五分之一范围内,将图像随机进行向左或向右平移;对图像按照指定的尺度因子进行放大或缩小,或利用指定的尺度因子对图像滤波构造尺度空间以改变图像内容的大小或模糊程度;随机使用最临近插值或双线性差值对空白处进行补齐,使得增强后的图像尺寸与原图尺寸相等;

在仿射变换的基础上,通过随机增强策略,将训练样本图像通过包括但不限于模糊、加噪、颜色空间转换、随机遮挡、随机擦除继续做数据增强处理。

7.根据权利要求1所述的基于尺度上下文的变电站图像目标检测方法,其特征是,基于K-means的锚框尺度制定策略具体为:假设簇划分为(C1,C2,…Ci…Ck),用μi表示簇Ci的均值向量,则K-means聚类目标就是最小化平方误差E;聚类结果图像由XY轴坐标系构成,每一点对应一个目标样本点,其横坐标代表目标宽度,纵坐标代表目标高度;每一样本点与原点之间连线的斜率表征了该目标的高宽比;计算各个簇中心点与坐标轴原点的连线的斜率,离散地选择合适的斜率值,使用尽量少的值覆盖更多的样本点;每一样本点横纵坐标的乘积表征该目标矩形包围框的面积;对簇中心横、纵坐标值之积开平方根,得到样本的尺寸分布从而调整锚框尺寸;

设样本点横、纵坐标分别为x和y,则锚框高宽比和尺寸的设置算法可以分别用分段函数A(x,y)和S(x,y)来表达:

其中,N表示设置N种不同高宽比的锚框,M表示设置M种不同尺寸的锚框。n=1,2,…N,m=1,2,…M,kn表示锚框高宽比的离散取值,sn表示锚框尺寸的离散取值,αn表示锚框高宽比的离散取值间隔,βn表示锚框尺寸的离散取值间隔;根据不同数据集聚类结果,通过实验调整N,M,kn,snnn的数值,使得离散取值区间划分合理,满足尽量多的样本点;其中,当n1时,kn-1n-1=knn,当m1时,sm-1m-1=smm

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江西省电力有限公司超高压分公司;国家电网有限公司;珠高智能科技(深圳)有限公司,未经国网江西省电力有限公司超高压分公司;国家电网有限公司;珠高智能科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210397810.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top