[发明专利]一种基于对抗生成网络的告警数据生成方法在审
申请号: | 202210452164.2 | 申请日: | 2022-04-27 |
公开(公告)号: | CN114844767A | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 霍永华;宋春晓;商英俊;罗有平;杨杨;喻鹏;李昱廷 | 申请(专利权)人: | 中国电子科技集团公司第五十四研究所;北京邮电大学 |
主分类号: | H04L41/0631 | 分类号: | H04L41/0631;H04L41/14;H04L41/142;G06N3/04 |
代理公司: | 河北东尚律师事务所 13124 | 代理人: | 王文庆;曲佳颖 |
地址: | 050081 河北省石家*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 生成 网络 告警 数据 方法 | ||
1.一种基于对抗生成网络的告警数据生成方法,其特征在于,包括以下过程:
S1、对输入的告警数据进行独热编码,将一段时间内的告警数据合并为一条含多条告警信息的数据,并进行填充,形成多条等长的告警数据;
S2、利用步骤S1处理后的告警数据对生成式对抗网络中的生成器及判别器分别进行预训练;并使用强化学习方法中的策略梯度方法训练生成器,具体为:生成器在生成数据的过程中,对于每一步所生成的不完整数据序列以数学模拟的方法生成完整序列,并利用判别器计算对应的奖励值,根据奖励值训练生成器;
S3、使用训练完成的生成器生成告警数据,并根据步骤S1中独热编码得到的解码器,将数字编码格式的告警数据转换为自然语言形式的告警数据。
2.根据权利要求1所述的基于对抗生成网络的告警数据生成方法,其特征在于,步骤S1具体包括:
S11、对输入的告警数据进行独热编码,组成告警数据的所有告警信息内容对应独特的编码,并将文本信息转换为离散数字信息;
S12、根据告警数据中的时间信息,将设定时间段内的告警数据合并为一条含多条告警信息的数据,形成多条告警数据;
S13、将形成的多条告警数据进行填充处理,处理为等长的数据。
3.根据权利要求1所述的基于对抗生成网络的告警数据生成方法,其特征在于,步骤S2中训练生成器及判别器时,生成器以下式为目标函数进行预训练:
其中,N为输入告警数据数量,yij是标签,如果类别是j,则yij=1,否则yij=0,pij为样本是j类的概率;预训练过程中以最小化目标函数为目标进行训练;
判别器以下式为目标函数进行预训练:
其中,N为输入告警数据数量,yij是标签,如果类别是j,则yij=1,否则yij=0,pij为样本是j类的概率;预训练过程中以最小化目标函数为目标进行训练。
4.根据权利要求1所述的基于对抗生成网络的告警数据生成方法,其特征在于,步骤S2中采用强化学习中的策略梯度方法训练生成器时,生成器的目标函数为:
其中,Gθ为生成器,θ为GRU生成器的参数,Dφ为判别器,φ为CNN判别器的参数,γ是一个告警内容的集合,每条告警数据都由γ中的元素所组成,S0为当前序列,Gθ(y1|S0)则代表了生成器认为在S0状态下,下一个生成的告警内容为y1的概率。
5.根据权利要求4所述的基于对抗生成网络的告警数据生成方法,其特征在于,步骤S2中,使用强化学习方法中的策略梯度方法训练生成器,具体过程包括:
生成器是一个门控循环单元GRU组成的循环神经网络,生成器逐步生成一个长度为T的告警数据,得到共T个数据子序列;
对于非完整的序列Y1:t,使用上限置信区间搜索算法,将非完整序列模拟为完整的数据;具体为:
首先在模拟的过程中,根据告警数据的信息和下一步可能产生的告警数据内容对应概率建立一棵树,在仿真中,最大化B值作为选择子节点的基准;B值定义如下:
其中,Bi,j表示在i节点处选择j分支的奖励,n表示总选择次数,nj表示j分支的选择次数,Xj表示选择j分支的平均奖励值;
由此模拟,通过不完整序列得到完整故障数据:
将通过模拟得到的完整告警数据输入判别器,判别器得到所有生成告警数据中间得到的子序列及完整序列对应的奖励值:
根据得到的奖励值更新梯度,训练生成器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十四研究所;北京邮电大学,未经中国电子科技集团公司第五十四研究所;北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210452164.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:钢箱梁双顶托举顶推安装方法
- 下一篇:一种PRRSV弱病毒及其制备方法和应用