[发明专利]一种基于向量化的日志模板提取方法和系统有效
申请号: | 201910431788.4 | 申请日: | 2019-05-23 |
公开(公告)号: | CN110175158B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 全哲;肖桐;周旭;唐卓;陈建国;姜文君;李肯立;李克勤 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/18 | 分类号: | G06F16/18;G06F16/2458;G06F40/194;G06F40/186 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 宋业斌 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 量化 日志 模板 提取 方法 系统 | ||
1.一种基于向量化的日志模板提取方法,其特征在于,包括:
一、离线日志模板提取过程,包括步骤:
(1)从预先收集的日志文件中获取所有日志记录,对其进行预处理,以得到预处理后的所有日志记录;
(2)对预处理后的所有日志记录进行向量化处理,以得到向量集合,并对得到的向量集合进行聚类,从而将该向量集合划分成多个向量簇
(3)对步骤(2)中得到的每个向量簇
(4)对步骤(3)得到的每个日志模板
二、在线日志模板提取过程,包括步骤:
(5)从日志文件中实时获取新产生的一条日志记录,并对其进行预处理,以得到预处理后的日志记录;然后对预处理后的日志记录进行向量化处理,以得到向量;
(6)采用步骤(2)中的聚类算法所使用的距离度量方法计算步骤(5)得到的向量与步骤(4)得到的各个模板向量
(7)从步骤(6)得到的所有距离中找出最小距离,并判断该最小距离是否大于预定的阈值
(8)将该日志记录本身作为一个新的模板,并对该模板执行与步骤(4)中相同的处理,过程结束;
(9)找出步骤(7)中得到的最小距离所对应的模板向量
(10)用通配符替代步骤(9)中得到的日志模板
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910431788.4/1.html,转载请声明来源钻瓜专利网。