[发明专利]基于因果语义关系传递的图卷积网络根因识别方法在审
申请号: | 202011264456.0 | 申请日: | 2020-11-12 |
公开(公告)号: | CN112507720A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 高炅;杨煜乾;杨树森 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06F40/289;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 闵岳峰 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 因果 语义 关系 传递 图卷 网络 识别 方法 | ||
1.基于因果语义关系传递的图卷积网络根因识别方法,其特征在于,该方法在知识图谱嵌入模型的启发下,基于因果语义关系传递的图卷积网络根因识别方法假设根因识别问题中的切片样本内告警和根因告警存在因果关系,并且因果关联网络同构,即:因果关系向量r、样本序列在因果关系空间表示xseq以及序列的根因告警在因果关系空间表示构成三元组满足关系结合概率统计知识、基于均值聚合器的GraphSAGE图卷积网络模型以及语义关系传递模块搭建基于因果语义关系传递的图卷积网络根因识别方法。
2.根据权利要求1所述的基于因果语义关系传递的图卷积网络根因识别方法,其特征在于,具体包括以下步骤:
1)数据特征选取及预处理:
选取告警细节属性作为输入数据在时间顺序下进行语义分析,基于GloVe模型提取告警细节的词向量表示;
2)全局因果关联先验邻接矩阵生成:
将训练集作为先验信息,计算两个告警xi,xj在同一样本中出现时告警xi为根因告警的频率,生成全局因果关联先验邻接矩阵;
3)因果关联邻接矩阵生成:
采取的因果关联邻接矩阵生成方法考虑语义和概率两个部分,使用全连接神经网络和激活函数进一步提取告警在关系层面的特征,结合范数获取语义邻接矩阵;将全局因果关联先验邻接矩阵作为概率邻接矩阵和权重矩阵,联合语义邻接矩阵生成因果关联邻接矩阵;
4)序列特征表示和告警特征表示学习:
由于单个切片样本内告警存在时序关系,因此首先使用双向LSTM网络即BiLSTM学习告警的时序特征表示;此外,考虑告警之间存在的因果图结构,将步骤3)中生成的因果关联邻接矩阵作为告警因果关联的网络拓扑结构,选取深层均值聚合器的GraphSAGE图卷积网络模型分别学习各个告警的特征表示;
5)因果语义关系传递模块:
将样本序列和样本中各告警的特征表示投影到低维因果关系空间,在假设因果关系r、样本序列在因果关系空间表示xpool以及序列的根因告警在因果关系空间表示构成三元组满足关系的前提下,运用BiLSTM模型、概率加权策略以及拼接策略得到最终的因果关系向量表达式,预测序列中各个告警为根因告警的概率,完成根因告警的识别。
3.根据权利要求2所述的基于因果语义关系传递的图卷积网络根因识别方法,其特征在于,步骤1)的具体操作为:告警数据中的告警细节属性对应时段内包含专家知识的故障或异常的语言描述,语义信息含有告警之间关系的隐式信息;选取告警细节属性作为输入数据在时间顺序下进行语义分析,将告警细节作为词表示模型中的分词,切片样本内告警细节组成的序列集合构成词表示模型的语料库,基于GloVe模型提取告警细节的词向量表示。
4.根据权利要求2所述的基于因果语义关系传递的图卷积网络根因识别方法,其特征在于,步骤2)的具体操作为:基于训练集先验信息,采用确定概率的频率方法,获取告警之间的因果频率,生成全局因果关联先验邻接矩阵。
5.根据权利要求2所述的基于因果语义关系传递的图卷积网络根因识别方法,其特征在于,步骤3)的具体操作为:因果关联邻接矩阵作为图卷积网络的输入数据之一,为模型提供图中节点之间的邻接信息;因果邻接矩阵生成考虑语义和概率两个部分,语义部分结合全连接层和激活函数学习告警的加权词向量表示,获取向量之间的2-范数,表示告警之间的相似关系,近似语义因果关联关系,生成语义邻接矩阵;概率部分则采用步骤2)中的全局因果关联先验邻接矩阵,作为因果关联邻接矩阵的权重矩阵;因果关联邻接矩阵则由语义邻接矩阵和概率邻接矩阵联合生成。
6.根据权利要求2所述的基于因果语义关系传递的图卷积网络根因识别方法,其特征在于,步骤5)的具体操作为:知识图谱嵌入模型的启发下,假设根因识别问题中的切片样本内告警和根因告警存在因果关系,并且因果关联网络同构,即:因果关系向量r、样本序列在因果关系空间表示xseq以及序列的根因告警在因果关系空间表示构成三元组满足关系
首先,为获取序列和根因告警的特征表示,将步骤4)中生成的因果关联邻接矩阵作为告警因果关联的网络拓扑结构,选取深层均值聚合器的GraphSAGE图卷积网络模型进行学习;为统一特征表示向量所属空间,样本序列特征表示向量和样本中各个告警的特征表示向量分别通过全连接层和激活层投影到低维因果关系空间;之后考虑不同三元组因果关系表示的特殊性,因果关系与序列相关,根据样本序列在因果关系空间表示xseq、样本序列表示及根因概率向量P,运用BiLSTM模型、概率加权策略以及拼接策略得到最终的因果关系向量表达式:
其中,为切片序列的矩阵表示,为切片序列中第i个告警的向量表示;P=[P1…Pl]为告警的根因概率向量,Pi表示训练集统计的告警i在切片样本中为根因告警的频率;l为告警切片中的告警数量,[;]为concatenate操作,·为Hadamard乘法;
最终采用2-范数对比序列根因告警预测值xseq+r与根因告警在因果关系空间表示作为当前方法的输出,预测序列中各个告警为根因告警的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011264456.0/1.html,转载请声明来源钻瓜专利网。