[发明专利]面向多业务应用场景的气象信息特征数据生成方法在审
申请号: | 202111105109.8 | 申请日: | 2021-09-22 |
公开(公告)号: | CN114266283A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 孙广辉;王亚军;李一鹏;孔祥玉;周超;徐俊杰;袁健;刘茂 | 申请(专利权)人: | 国网河北省电力有限公司;国电南瑞南京控制系统有限公司;国家电网有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 董一宁 |
地址: | 050021 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 业务 应用 场景 气象 信息 特征 数据 生成 方法 | ||
1.一种面向多业务应用场景的气象信息特征数据生成方法,其特征在于:利用生成对抗网络进行数据生成,生成对抗网络包括生成器与判别器两部分,正方包含一个判别器A,目的是区分训练集中的样本和生成网络生成的新样本;反方包含一个判别器B和一个生成器,反方判别器B的目的是指导生成网络生成逼近训练集样本的新样本,判别式网络的损失函数同时也是生成网络的损失函数。
2.根据权利要求1所述的面向多业务应用场景的气象信息特征数据生成方法,其特征在于:所述判别器A是一个结构普通的判别式神经网络分类器,生成对抗网络将神经网络训练的样本分为真、假两类,来自于训练数据集的样本标签定义为真标签,而由生成网络生成的新样本的标签定义为假,判别器A实现最基本的二元分类功能,损失函数也能使用基本的二元交叉熵,判别器A的目的就是识别由生成网络产生的样本为假样本。
3.根据权利要求1所述的面向多业务应用场景的气象信息特征数据生成方法,其特征在于:生成对抗网络设定整体网络中的一个隐藏层的数据是生成样本,以该层为分界,之前的神经网络是生成网络,而之后的神经网络则是判别网络,判别器B输出一个概率值作为损失函数的输入,损失函数同样采用最基本的二元交叉熵,目的是为了让生成网络产生符合真实样本概率分布的新样本,因此生成网络持有和判别网络不同的真假认知,损失函数的优化效果会顺着整个网络往下传递,借由判别式网络为媒介向下继续更新生成网络的参数。
4.根据权利要求1所述的面向多业务应用场景的气象信息特征数据生成方法,其特征在于:生成对抗网络的训练方法,循环以下两个步骤:
(1)成因子输入生成网络生成标签为假的新样本,该新样本不再在反方的前馈网络中向上进行数据流传递,而是与原样本空间标签为真的样本一起作为判别网络的训练数据集,生成样本代表着博弈的一方生成式网络相关信息,判别网络根据此训练集学习成一个二元分类器,对原始样本输出尽可能接近1的概率值,对生成样本输出尽可能接近0的概率值,这里令这个二元分类器为分类器A;
(2)将过程一训练好的分类器A的网络参数直接迁移到反方的判别网络,反方的判别网络继承了分类器A分类真假样本的能力,令其为分类器B,此时将生成样本的假标签值替换为真标签值,作为分类器B的训练数据集;使用该训练集训练分类器B,更新整个生成网络的参数,提升生成网络的样本生成能力,生成出分类器A更难识别的新样本;
重复这两个过程,直到分类器A和分类器B都无法分辩出真假样本为止,此时GAN生成样本的效果就逼近了从样本概率分布采样的效果;
正方判别网络的损失函数公式为:
min Ep(x)logDA(x)+Ep(g(z))log(1-DA(G(z))) (3)
其中G(z)表示生成网络根据生成因子(隐藏变量)z生成的新样本,DA(x)是分类器A输出真样本的条件概率,DA(G(z))是分类器A输出生成样本的条件概率,判别网络要分辨出真假样本,则分类器A的输出DA(x)应该尽可能的大,而DA(G(z))应该尽可能的小,转换成损失函数表达,建立了一对极大极小概率似然函数:
对极大项做如下处理:
通过将DA(G(z))的概率取反,表达的含义就和DA(x)相同了,也就构成了的判别式网络最终的损失函数的形式,这个函数在数学上精确的表达了真假样本的对抗性;
反方判别网络的真假认知与判别网络相反,反方的分类器B希望给生成样本G(z)接近于1的概率值,且不存在对真实样本的判断,反方判别网络的损失函数如下:
min Ep(g(z))logDB(G(z)) (6)
该损失函数的意义正好与正方相反,但是分类器B却和分类器A共享着分类器A的网络参数,因此分类器B会给生成样本G(z)一个接近于0的概率值,而这种反差通过损失函数表达后就是一种强烈的反馈,这种反馈会促使网络更新参数去生成更接近真实样本x的生成样本G(z),从而让分类B给予生成样本G(z)一个接近于1的概率值,最终与损失函数所表达的意义一致。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河北省电力有限公司;国电南瑞南京控制系统有限公司;国家电网有限公司,未经国网河北省电力有限公司;国电南瑞南京控制系统有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111105109.8/1.html,转载请声明来源钻瓜专利网。