[发明专利]一种基于在线层次聚类的日志模板抽取方法有效
申请号: | 201910201303.2 | 申请日: | 2019-03-18 |
公开(公告)号: | CN109981625B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 钱叶魁;杨瑞朋;黄浩;杜江;雒朝峰;李宇翀;宋彬杰 | 申请(专利权)人: | 中国人民解放军陆军炮兵防空兵学院郑州校区 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06K9/62 |
代理公司: | 中国兵器工业集团公司专利中心 11011 | 代理人: | 张然 |
地址: | 450052 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于在线层次聚类的日志模板抽取方法,其中,包括:进行日志预处理;对预处理后的日志进行日志在线向量化,利用分布式的词向量表示方法对日志进行在线向量化,在线层次聚类算法对原始日志聚类,生成日志模板;日志在线层次聚类包括:在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点,根节点聚类覆盖了全部的所有数据点,每个叶子节点即对应一条日志向量,任意一个内部节点对应一个类簇,类簇中的元素是以内部节点为祖先节点的所有叶子节点。本发明基于在线层次聚类的日志模板抽取方法不仅适合多源异构日志模板抽取,而且准确度更高,且单步执行时间完全能够满足在线日志分析的需要。 | ||
搜索关键词: | 一种 基于 在线 层次 日志 模板 抽取 方法 | ||
【主权项】:
1.一种基于在线层次聚类的日志模板抽取方法,其特征在于,包括:进行日志预处理;对预处理后的日志进行日志在线向量化,利用分布式的词向量表示方法对日志进行在线向量化,在线层次聚类算法对原始日志聚类,生成日志模板;日志在线层次聚类包括:在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点,根节点聚类覆盖了全部的所有数据点,每个叶子节点即对应一条日志向量,任意一个内部节点对应一个类簇,类簇中的元素是以内部节点为祖先节点的所有叶子节点;日志在线层次聚类算法包括:第1步:插入新日志向量,遍历当前聚类树,比较新插入日志向量节点l’与所有已插入的所有日志向量的叶子节点的距离,找到距离最近的日志向量l;有节点被遮蔽后对树的调整,直接插入日志向量节点l’,使得日志向量节点l和日志向量节点l’有共同的父节点;对于直接插入节点对树的调整,调整树的结构,使得日志向量节点l和日志向量节点l’有共同的父节点;第2步:判断是否有节点被遮蔽,判断依据为公式(5):其中,v′为v的兄弟节点,lvs(v′)表示内部节点v′包含的所有日志向量的集合,a为v父节点的兄弟节点,x∈lvs(v);第3步:对聚类树中不平衡的树进行基于平衡二叉树的旋转;进行日志在线模板抽取。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军陆军炮兵防空兵学院郑州校区,未经中国人民解放军陆军炮兵防空兵学院郑州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910201303.2/,转载请声明来源钻瓜专利网。
- 上一篇:入侵检测方法、装置及存储介质
- 下一篇:一种账户认证方法及装置