[发明专利]基于GAN处理不平衡数据的线变关系识别方法在审
申请号: | 202210471153.9 | 申请日: | 2022-04-28 |
公开(公告)号: | CN114818940A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 郭金智;王燕;朱正甲;皇甫成;范荻;汪鸿;陈建华;秦亮;刘开培;张心语 | 申请(专利权)人: | 华北电力科学研究院有限责任公司;国网冀北电力有限公司;国家电网有限公司;武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06Q50/06 |
代理公司: | 北京孚睿湾知识产权代理事务所(普通合伙) 11474 | 代理人: | 韩燕 |
地址: | 100086 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gan 处理 不平衡 数据 关系 识别 方法 | ||
1.一种基于GAN处理不平衡数据的线变关系识别方法,其特征在于:其包括以下步骤:
S1、通过用户电量采集系统采集10kV输电线路的日输入电量以及输电线路连接的各配电变压器的日用电量,对采集到的电量数据进行数据预处理,得到日线损电量,并将配电线路线变关系分为三个类别:线路挂错线变关系、电能表倍率计错线变关系和正常线变关系,建立线变关系识别的原始数据集;
S2、利用皮尔逊系数、相对变化系数、波动系数和斜率比四种参数从配电线路日线损电量、配电线路日输入电量以及各变压器日用电量中提取12个特征量,作为线变关系识别的特征集;
S3、利用GAN对线变关系特征集中只占极少数的线变关系异常样本进行数据扩充,从而实现不同线变关系类别间样本数量的分布均衡,具体包括如下子步骤:
S31、搭建基于GAN的线变关系异常样本的数据生成模型,该数据生产模型包括生成器模型和判别器模型,生成器模型中全连接神经网络的输入层、隐含层和输出层均设计为1层,且各层节点数分别设计为10、50和12,判别器模型设计为全连接神经网络的输入层、隐含层和输出层构成的二分类器,网络中输入层、隐含层和输出层节点数分别设计为12、50和1,数据生成模型的学习率设置为0.01,基于GAN处理线变关系数据不平衡的网络模型总的迭代次数设置为5000;
S32、构建GAN模型的目标函数为:
其中,V(D,G)表示GAN模型的目标函数,D(·)表示判别器模型的输出,E(·)表示期望值,D(x)表示判别器认为x是真实样本的概率,G(z)表示随机信号z是经过生成器模型G得出的合成样本,1-D(G(z))为判别器模型认为合成样本为假的概率,x~Pdata(x)指的是从真实样本分布中采样,z~Pz(z)指的是从噪声分布Pz(z)中采样;
S33、生成器模型的损失函数设为g_loss=log(D(G(z))),判别器模型的损失函数设为:d_loss=-log(D(x))+log(1-D(G(z)));
其中,G(z)表示随机信号z是经过生成器模型G得出的生成样本,x表示真实的线变关系异常样本数据,D(·)表示判别器模型的输出;
S34、利用损失函数训练生成器与判别器模型,其具体包括以下子步骤:
S341、训练过程采用生成器模型与判别器模型单独交替迭代训练,先固定生成器模型,训练判别器模型,之后固定判别器模型,训练生成器模型;
S342、当训练判别器模型时,将上一轮生成器模型产生的样本数据和真实样本数据拼接在一起作为判别器模型的输入,其中假样本的标签设定为0,真样本的标签设定为1,之后通过判别器模型,生成一个概率值η,η为0到1之间的数,通过概率值η和目标值组成的损失函数,采用随机梯度下降法对判别器中神经网络的权值进行更新;
S343、当训练生成器模型时,将生成器模型和判别器模型作为一个整体进行输出,输入一组随机向量,在生成器模型中生成一个样本数据,通过判别器模型对生成的样本数据进行判别得到输出结果概率值η,将概率值η与1之间的差异组成损失函数,之后采用随机梯度下降法对生成器中神经网络的权值进行更新;
S344、根据步骤S342和步骤S343完成生成器模型与判别器模型的单独交替迭代训练,当Pg=Pdata时,即判别器模型对生成样本与真实样本输出的概率值均为0.5时,此时GAN模型的目标函数达到全局最优解,其中,Pg表示判别器对生成样本的判别结果,Pdata表示判别器对真实的线变关系异常样本数据的判别结果;
S35、使用训练好的生成器模型对线变关系特征集中只占极少数的线变关系异常样本进行数据扩充,得到与真实线变关系样本数据整体分布类似的生成样本,从而实现不同线变关系类别间样本数量的分布均衡;
S4、利用经样本扩充后的线变关系特征集,构建支持向量机分类模型,通过支持向量机分类模型的核函数选择、惩罚参数和核函数系数寻优,得到优化后的线变关系分类模型,从而实现线变关系的识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力科学研究院有限责任公司;国网冀北电力有限公司;国家电网有限公司;武汉大学,未经华北电力科学研究院有限责任公司;国网冀北电力有限公司;国家电网有限公司;武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210471153.9/1.html,转载请声明来源钻瓜专利网。