[发明专利]一种基于词嵌入的日志参数异常检测方法在审
申请号: | 202010880971.5 | 申请日: | 2020-08-27 |
公开(公告)号: | CN112069787A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 王换招;王肖晨;张鹏;单丹枫 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/242;G06N3/04;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 马贵香 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 嵌入 日志 参数 异常 检测 方法 | ||
1.一种基于词嵌入的日志参数异常检测方法,其特征在于,包括如下步骤;
步骤一、将日志中的所有参数解析出来,并将所有参数中的离散参数单独划分出来;
步骤二、将离散参数转换为连续的参数词向量;
步骤三、使用长短期记忆神经网络模型训练参数词向量,使用训练完成的参数词向量预测后续目标时刻的参数词向量;
步骤四、使用余弦相似度来确定预测参数词向量与目标参数词向量的关联程度,通过关联程度计算损失值,从而将损失值反馈网络,进行更新和优化模型,直至收敛;
步骤五、获取日志进行参数异常检测,计算预测参数和目标参数的余弦相似度,余弦相似度低于阈值则为检测到日志参数异常。
2.根据权利要求1所述的基于词嵌入的日志参数异常检测方法,其特征在于,步骤一中,通过Spell方法解析出日志中的所有日志模板,按照日志模板过滤出日志中的所有参数,并通过正则化判断的方式将离散参数单独划分出来。
3.根据权利要求1所述的基于词嵌入的日志参数异常检测方法,其特征在于,步骤二中,以所有离散参数构造词向量词典,对词向量词典进行词嵌入训练,经过自监督的word2vec模型训练后,词向量词典中的所有有效词语都转换成了彼此之间相互关联的固定维度数值的参数词向量,即连续的参数词向量。
4.根据权利要求1所述的基于词嵌入的日志参数异常检测方法,其特征在于,步骤三中,将参数词向量从词向量词典中筛选出来,按照原本的时序顺序,以参数位置和日志时序折衷的方式进行数据处理,每次的输入是目标时刻的日志前一定窗口内的完整的日志中所有参数词向量,使用长短期记忆神经网络模型计算和预测后续目标时刻的参数词向量。
5.根据权利要求4所述的基于词嵌入的日志参数异常检测方法,其特征在于,长短期记忆神经网络模型包括依次连接的一个输入层、多个隐藏层和一个输出层。
6.根据权利要求1所述的基于词嵌入的日志参数异常检测方法,其特征在于,步骤四中,通过余弦相似度用来度量预测参数词向量与目标参数词向量的夹角大小,向量之间的相似度可以通过计算两个向量夹角的余弦值从方向角度来量化,若两个向量方向一致,则余弦值为1,若两者方向是相反的,则其值为-1,其公式为
7.根据权利要求1所述的基于词嵌入的日志参数异常检测方法,其特征在于,步骤五中,按照一定设定窗口将日志输入至长短期记忆神经网络模型中,输出预测参数词向量,使用余弦相似度将目标参数词向量和预测参数词向量进行对比,当余弦相似度小于阈值则判定为异常,当余弦相似度大于等于阈值则判定为正常。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010880971.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:扬声器箱
- 下一篇:一种活性焦烟气净化吸附装置