[发明专利]一种基于CGAN的巡检图像数据小样本扩充方法有效

专利信息
申请号: 202011360952.6 申请日: 2020-11-27
公开(公告)号: CN112446429B 公开(公告)日: 2022-06-21
发明(设计)人: 张谨立;游林辉;葛阳;庾凌云;胡峰;孙仝;陈政;宋海龙;黄达文;王伟光;梁铭聪;黄志就;谭子毅;陈景尚;李志鹏;冯海林 申请(专利权)人: 广东电网有限责任公司肇庆供电局
主分类号: G06V10/764 分类号: G06V10/764;G06K9/62;G06N3/04;G06N3/08;G06V10/774
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 刘瑶云
地址: 526060 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 cgan 巡检 图像 数据 样本 扩充 方法
【权利要求书】:

1.一种基于CGAN的巡检图像数据小样本扩充方法,其特征在于,包括以下步骤:

S1.收集巡检图像,根据经验判别巡检图像对应的缺陷类型,并人工对图像进行标注,获得巡检图像数据集;使用异常检测算法,剔除巡检图像数据集中的异常图像;巡检图像数据集中异常巡检图像的检测步骤包括:

采集的巡检图像数据为RGB彩色图片,因此是具有3个通道二维矩阵的三阶张量;将三阶张量压缩为一维向量的形式后使用LOF离群点判别算法进行异常巡检图像数据清洗;遍历巡检图像数据集并根据计算公式得到所有巡检图像数据向量的局部离群因子,局部离群因子大于设定阈值的巡检图像为异常数据;

遍历巡检图像数据集并根据计算公式得到所有巡检图像数据向量的局部离群因子,局部离群因子大于设定阈值的巡检图像为异常数据;具体的计算步骤包括:

设压缩后的一维向量共有m个分量,则向量x和y的距离d(x,y)可使用下式表示:

式中xi和yi(i=1,2,…,m)表示数据向量x和y的第i个分量;

将距离数据向量x第k远的数据向量yk与数据向量x之间的距离称作数据向量x的第k距离dk(x),用公式可表示为:

dk(x)=d(x,yk)

将数据向量x和数据向量y之间的距离d(x,y)与数据向量x的第k距离dk()的最大值,称作数据向量x和数据向量y的第k可达距离,即:

rk(x,y)=max{dk(x),d(x,y)}

定义与数据向量x之间距离小于等于dk(x)的所有数据向量构成的集合为数据向量x的第k邻域Nk(x),|Nk(x)|为第k邻域中数据向量的个数;数据向量x的局部可达密度lrdk(x)可表示为第k邻域内所有数据向量与数据向量x第k可达距离平均值的倒数,即:

数据向量x的局部离群因子LOFk(x)表示了数据向量x的局部可达密度与第k邻域内其他数据向量局部可达密度之间的相对大小关系,其表达式为:

如果数据向量x的局部离群因子LOFk(x)相较于其他数据向量过大,说明数据向量x的局部可达密度低,偏离了其他数据向量,可能是异常数据;

S2.使用传统图像处理算法,对清洗后的巡检图像数据集进行预处理,进一步提升图像数据质量并进行数据增强;

S3.使用巡检图像数据集训练基于卷积神经网络CNN的条件生成对抗网络CGAN,得到可生成给定缺陷类型巡检图像数据的CGAN模型;训练条件生成对抗网络CGAN具体包括以下步骤:

S31.条件生成对抗网络由生成器和判别器组成,设判别器模型为D(x|y),参数为θd,生成器模型为G(z|y),参数为θg

S32.设巡检图像数据集的分布为pdata(x),从数据集采样m组巡检图像数据{x1,x2,…,xm}和对应的标签{y1,y2,…,ym},从隐变量z的先验分布pg(z)中采样m组隐变量数据{z1,z2,…,zm};

S33.使用上一步中采样的隐变量和标签,使用生成器生成巡检图像数据其中

S34.使用从巡检图像数据集中采样的巡检图像数据和生成的巡检图像数据,计算判别器价值函数V,其表达式为:

使用判别器价值函数关于判别器参数θd的梯度更新θd,即:

其中η为学习率,是需要设定的超参数;

如果判别器参数更新的次数未达到给定次数,返回步骤S32,否则继续;

S35.从隐变量z的先验分布pg(z)中采样m组隐变量数据{z1,z2,…,zm},从巡检图像数据集中采样m组标签{y1,y2,…,ym},计算生成器的价值函数其表达式为:

使用生成器价值函数关于生成器参数θg的梯度更新θg,即:

S36.如果生成器参数更新次数未达到给定次数,返回步骤S32,否则训练结束;

S4.使用步骤S3中训练好的CGAN模型的生成器,采样并生成大量巡检图像数据;根据判别器输出的图像真实度,筛选真实度大于给定真实度阈值的生成图像加入巡检图像数据集,得到扩充巡检图像数据集;

S5.将扩充巡检图像数据集划分为训练集和测试集,使用训练集训练基于ResNet-50的巡检图像缺陷分类模型,并使用测试集测试巡检图像缺陷分类模型的分类准确率;如果准确率达到设定的准确率,样本扩充结束;否则重新选取判别器输出的图像真实度的阈值,返回步骤S4;具体包括:

S51.首先将依据步骤S4得到的满足判别器输出图像阈值的生成图像结合步骤S2预处理后的原始图像得到扩充后的巡检图像样本;

S52.构建巡检图像残差网络ResNet-50模型;ResNet模型首先对输入进行卷积操作,在卷积操作中,需要将图像这一结构化数据首先经过卷积核的处理、然后批标准化处理、经过激活函数后经过最大值池化;经过卷积操作后,数据将经过四个残差块处理,四个残差块分别包含了3、4、6、3个Bottleneck;

Bottleneck中包含两种block,分别是Conv Block和Identity Block;数据经过残差层处理后,再经过平均值池化函数以及全连接网络经softmax函数得到输出向量,最后依据输出值判定类别;

S53.将扩充的巡检图像样本划分为训练集、验证集和测试集,使用训练集对巡检图像进行分类;包含污闪、爆裂、雷击三种缺陷类型以及正常情况四类;在训练时采用Adagrad优化方法更新神经网络的参数;

S54.ResNet-50模型的测试:选取划分好的测试集,输入至训练好的模型中,得到模型预判的缺陷类型;将实际缺陷类型与预判的缺陷类型进行对比得到模型预测的准确率;

S55.如果准确率大于设定值,则选定该判别器输出图像的真实度阈值为最终的生成图像筛选阈值;否则,提高阈值使判别器输出图像的真实度提高,以提高分类模型的分类准确率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司肇庆供电局,未经广东电网有限责任公司肇庆供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011360952.6/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top