[发明专利]集群日志特征提取方法、装置及存储介质在审
申请号: | 201910123928.1 | 申请日: | 2019-02-19 |
公开(公告)号: | CN109992569A | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | 吴超勇;陈仕财 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/17 | 分类号: | G06F16/17;G06F16/182;G06F16/215 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 董永辉;李玉琦 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基架运维,提供一种集群日志特征提取方法、装置及存储介质,通过flume客户端采集服务器集群的日志,发送至数据库;对日志数据进行数据清洗,筛选出原始数据;对原始数据进行包括均值、有效值、峰值、方根幅值、波形指标、脉冲指标、峭度指标的特征值提取;将提取的特征值分别与原始数据进行皮尔逊相关系数的运算,根据计算出的相关系数与相关度阈值进行比较,高于相关度阈值则认为是有效数据,低于相关度阈值则认为是无效数据并予以剔除。本发明能有效筛选出服务器集群中各主机的生产数据的有效信息,且从有效信息中提取出生产数据的特征值,便于生产系统的故障预测和故障分类,减少生产事故的发生。 | ||
搜索关键词: | 原始数据 相关度 集群 存储介质 日志特征 生产数据 有效信息 采集服务器 服务器集群 特征值提取 波形指标 故障分类 故障预测 日志数据 生产事故 生产系统 数据清洗 无效数据 有效筛选 有效数据 客户端 脉冲 基架 峭度 日志 运维 剔除 运算 主机 数据库 发送 筛选 | ||
【主权项】:
1.一种集群日志特征提取方法,应用于电子装置,其特征在于,包括以下步骤:通过flume客户端采集服务器集群的日志,发送至Hbase数据库,其中,flume客户端通过多个Agent进程对应采集服务器集群中的每台服务器的日志,Agent定时将对应的服务器上的日志数据收集并通过API接口发送到Hbase数据库;利用Hadoop对日志数据进行数据清洗,筛选出原始数据,其中原始数据至少包括服务器磁盘占用率、内存使用率、cpu占用率、业务接口调用量;对原始数据进行包括均值、有效值、峰值、方根幅值、波形指标、脉冲指标、峭度指标的特征值提取;运用皮尔逊相关系数筛选出有效特征:将提取的特征值分别与原始数据进行皮尔逊相关系数的运算,根据计算出的相关系数与相关度阈值进行比较,高于相关度阈值则是有效数据,低于相关度阈值则是无效数据,并予以剔除。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910123928.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种信息处理方法及装置
- 下一篇:一种嵌入式系统的文件同步方法