[发明专利]基于尺度上下文的变电站图像目标检测方法在审
申请号: | 202210397810.X | 申请日: | 2022-04-15 |
公开(公告)号: | CN114882208A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 徐波;李福德;李志坤;钟成;夏祥波;林谋 | 申请(专利权)人: | 国网江西省电力有限公司超高压分公司;国家电网有限公司;珠高智能科技(深圳)有限公司 |
主分类号: | G06V10/24 | 分类号: | G06V10/24;G06V10/20;G06V10/774;G06V10/25;G06V10/762;G06K9/62;G06V10/80;G06V10/82;G06V10/44;G06V10/764;G06V10/766;G06N3/04;G06N3/08 |
代理公司: | 南昌丰择知识产权代理事务所(普通合伙) 36137 | 代理人: | 吴称生 |
地址: | 330000 江西省南昌*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 上下文 变电站 图像 目标 检测 方法 | ||
本发明公开了一种基于尺度上下文的变电站图像目标检测方法,采用基于仿射变换的数据增强和随机增强策略完成数据集扩充,得到数据增强后的训练集;采用经过预训练的VGG‑16模型作为特征提取网络,每张输入图像在一系列卷积及池化后,得到不同尺寸的卷积特征图;使用区域提名网络进行候选框提取,得到感兴趣区域;将感兴趣区域映射到特征提取网络的卷积特征图上,并对其对应区域进行感兴趣区域池化,再通过两层全连接层,输出融合特征;对输出的融合特征进行分类和定位,在分类时,采用Soft‑NMS算法去除冗余框。本发明采样数据增强、锚框尺度调整策略,在可见光数据集以及红外数据集上分别证明了所提方法的有效性。
技术领域
本发明属于变电站检测技术领域,涉及一种基于尺度上下文的变电站图像目标检测方法。
背景技术
传统的目标检测算法包括选取候选框、表征提取和分类器判定三个阶段。选取候选框阶段的任务是提取图像中可能包含目标的区域位置,即感兴趣区域(Region ofInterest,RoI)。基本思想是先用不同尺寸的窗口滑动扫描整幅图像,判断每个窗口中是否含有目标,将含有目标的窗口作为候选框。特征提取阶段,利用滑动窗口在图像的每个区域上取得特定长度的表征向量,从而捕获该区域的语义判别信息。由于图像目标存在视角多元、光线变化和背景复杂等问题,因此难以设计鲁棒性强的特征提取模型来描述不同条件下的目标特征。分类器判定阶段,目的是为候选框分配类别标签。
视觉对象出现在特定的环境中,且通常与其他相关目标共存。人类视觉进行目标识别任务的优势,很大程度上依赖于上下文信息。上下文信息在计算机视觉的目标检测任务中,也起到至关重要的作用。上下文信息能够在一定程度上消除检测的不确定性,减少歧义,增强检测结果的可靠性。适当地对上下文信息进行建模,有助于目标识别与定位,尤其是当目标的外观特征不足时,例如目标尺寸小、受遮挡或图像质量差的情况。为了充分挖掘数据之间的关联,近年来,基于上下文信息的目标检测方法成为了检测领域的研究热点。
基于深度学习的目标检测技术,在电力领域的红外图像和可见光图像中都得到了广泛应用。然而,电力设备具有尺度多样性的特点,大小尺寸、高宽比差异较大,但鲜有工作针对电力设备存在的尺度多样性特点进行研究。
发明内容
针对设备尺度多样性引起的查全率不高的问题,面向变电站设备检测的需要,通过从数据和特征两个层面充分挖掘尺度上下文信息,本发明提出了一种基于尺度上下文的变电站图像目标检测方法。在数据层面进行了两点设计,分别是基于仿射变换的数据增强方式和基于K-means聚类的锚框尺度制定策略。卷积神经网络具有分层提取特征的特点,为了充分利用不同尺寸感受野的卷积特征,在特征层面,进行多尺度特征融合。
本发明通过下述技术方案来实现。一种基于尺度上下文的变电站图像目标检测方法,包括以下步骤:
步骤一、数据预处理:采用基于仿射变换的数据增强和随机增强策略完成数据集扩充,得到数据增强后的训练集;
步骤二、特征提取:采用经过预训练的VGG-16模型作为特征提取网络,每张输入图像在一系列卷积及池化后,得到不同尺寸的卷积特征图;
步骤三、提取感兴趣区域:使用区域提名网络进行候选框提取,得到感兴趣区域;区域提名网络首先对特征提取网络的最后一层卷积特征图进行滑窗操作,在每个窗口的中心位置生成一系列锚框;利用基于K-means的锚框尺度制定策略,通过对训练集标注文件中矩形包围框的长、宽进行于K-means聚类得到数据分布,从而调整锚框尺度;
步骤四、多尺度特征融合:将感兴趣区域映射到特征提取网络的卷积特征图上,并对其对应区域进行感兴趣区域池化,再通过两层全连接层,输出融合特征;
步骤五、分类和定位:对输出的融合特征进行分类和定位,在分类时,采用Soft-NMS算法去除冗余框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江西省电力有限公司超高压分公司;国家电网有限公司;珠高智能科技(深圳)有限公司,未经国网江西省电力有限公司超高压分公司;国家电网有限公司;珠高智能科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210397810.X/2.html,转载请声明来源钻瓜专利网。