[发明专利]面向变电站核心工控业务的流量基线模型构造方法有效
申请号: | 202110678519.5 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113408202B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 朱宏宇;田建伟;田峥;孙卓;孙毅臻;高雅婷;岳钢;向行;杨志邦 | 申请(专利权)人: | 国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06N3/04;G06N3/08;H02J3/00;H02J13/00;G06F17/16;G06F17/18;G06Q50/06 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410004 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 变电站 核心 业务 流量 基线 模型 构造 方法 | ||
1.一种面向变电站核心工控业务的流量基线模型构造方法,包括如下步骤:
S1.解析变电站的数据流,获得业务基本特征,并根据获取的业务基本特征计算得到表示业务流交互的高阶特征;
S2.进行同类业务的聚类;
S3.根据获取的基本特征和高阶特征,生成最终的原始输入特征矩阵;
S4.构造基于卷积神经网络自编码器,并学习步骤S3得到的原始输入特征矩阵的关联关系,从而得到高维中间层特征;具体为采用如下步骤构建自编码器:
自编码器的输入为2*N维原始特征矩阵x,其中N为业务流单向特征维度;自编码器为基于双层卷积神经网络的自编码器;编码器与解码器的结构镜像对称;编码器中第一卷积层函数为f1(·),第二层卷积层函数为f2(·),编码器输出为业务中间层特征向量h,编码器建立起中间层特征向量与输入特征矩阵间映射关系为h=f2(f1(x));解码器同样为两层卷积神经网路,其中第一层解码器用以解码第二层码编码器结果,其解码函数为g2(·),第二层解码器用以解调第一层编码器结果,其解码函数为g1(·),最终解码输出结果为解码器建立输出特征矩阵与中间层特征向量间映射关系为最终利用中间层特征向量h表示原始特征向量关联关系;
通过最小化平均绝对误差作为损失函数用以训练自编码器网络:
式中x为原始数据流特征矩阵;为自编码器重构特征矩阵;m为特征矩阵维度;xi为特征矩阵中第i维特征值;为自编码器重构特征矩阵中第i维特征值;
将原始特征矩阵作为输入特征矩阵按批次迭代训练自编码器,通过目标函数判断网络是否学习到原始特征分布:当目标函数值各批次训练结果符合设定要求时,说明自编码器能够拟合各业务原始特征分布,最终中间层向量h表示原始特征关联关系;
S5.对步骤S4得到的高维中间层特征进行降维,并计算得到表示业务交互流程的低维关键特征;具体为变电站内核心工控业务通过自编码器后得到高维中间层特征h,通过主成分分析法将高维特征映射到低维全新正交特征上,消除高维度特征内冗余数据,得到业务关键特征;
经业务分类后得到变电站共有n类核心业务,中间层特征h具有m维,对于同一核心工控业务,其特征分布相同,通过抽样计算同一业务的各维中间层特征均值,以此得到m*n维不同业务的中间层特征矩阵
对中间层特征矩阵X进行零均值化处理得到矩阵X',并计算X'的协方差矩阵C,可知矩阵C为对称矩阵,如下所示:
C=X'×(X')T
式中为中间层特征矩阵行均值;N为特征矩阵列数;sum()为特征矩阵按行求和;
分别计算业务协方差矩阵C的特征值和对应的特征向量;对业务特征值进行降序,根据特征值影响因子设置阈值δ,将大于δ的特征值对应的特征向量生成转移矩阵P,对自编码器中间层特征h与转移矩阵P做点积操作得到降维后关键特征K,其中h维度为1*m,P维度为m*v,K维度为1*v,v为大于特征阈值δ的个数;K=h×P;
S6.针对每一维度,计算若干周期内的正态分布参数;具体为利用中心极限定理将未知先验概率的同业务特征分布转换为正态分布;具体参数计算为:
a.相同业务满足同一概率分布,得到周期采样数据的关键特征;假设业务集合为S={S1,S2,...,Sn},周期内的各业务Si∈S关键特征为:
Keyi=(ki1,ki2,...,kiv)T
式中Keyi为第i类业务的关键特征向量;kij为第i类业务关键特征向量中第j维向量取值;
b.计算L个周期内相同业务的关键特征均值,业务Si在L个周期内特征向量为:
Vil=(Keyi1,Keyi2,...,Keyil)
式中Keyij为第i类业务第j个周期内的关键特征向量,j=1,2,...,l;
求第i类业务关键特征向量Vi在L周期内各维度均值向量其中各元素满足正态分布:
式中Vil为业务Si在L个周期内特征向量;
c.利用最大似然估计得到业务Si在L周期内的各维度关键特征的正态分布参数,假设经过W次L周期采样后,业务Si中关键特征j得到的正态分布参数为各参数计算方法为:
式中w为周期重复采样的次数;为第i类业务第j维特征在第n次周期采样后的均值;
d.得到业务Si关键特征中各维度参数
S7.构造各业务内多维关键特征联合高斯分布函数,最终得到业务基线模型;具体为获得关键特征各维分布参数后,通过联合高斯分布实现维度整合,得到业务的数据基线模型;联合高斯分布关键在于计算各维度间相关系数,相关系数计算公式为
式中COV()为关键特征中第l类业务中第i维与第j维特征均值的相关系数;
根据各维度间相关系数得到协方差矩阵∑,最终业务基线模型为联合高斯分布概率模型,表示方式为:
同样利用最大似然估计计算协方差矩阵∑,计算公式如下,其中v为关键特征维度:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司,未经国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110678519.5/1.html,转载请声明来源钻瓜专利网。