[发明专利]一种日志的处理方法、服务器及存储介质有效
申请号: | 201910211921.5 | 申请日: | 2019-03-20 |
公开(公告)号: | CN109992475B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 陈涛 | 申请(专利权)人: | 网宿科技股份有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/34;G06F18/22;G06F18/24 |
代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 日志 处理 方法 服务器 存储 介质 | ||
1.一种日志的处理方法,其特征在于,包括:
获取待处理的日志;
对所述待处理的日志进行处理,得到所述待处理的日志的词袋;
将所述待处理的日志的词袋与历史日志的词袋进行对比,确定所述待处理的日志的词袋与所述历史日志的词袋的关系;
根据所述待处理的日志的词袋与所述历史日志的词袋的关系,确定是否保留所述待处理的日志;
所述根据所述待处理的日志的词袋与所述历史日志的词袋的关系,确定是否保留所述待处理的日志,具体包括:
若确定所述待处理的日志的词袋与所述历史日志的词袋的关系为第一关系或第二关系,删除所述待处理的日志;
若确定所述待处理的日志的词袋与所述历史日志的词袋的关系为第三关系,保留所述历史日志的时间戳部分和所述待处理的日志的词袋;
若确定所述待处理的日志的词袋与所述历史日志的词袋的关系为第四关系或第五关系,保留所述待处理的日志的时间戳部分和所述待处理的日志的词袋。
2.根据权利要求1所述的日志的处理方法,其特征在于,所述对所述待处理的日志进行处理,得到所述待处理的日志的词袋,具体包括:
删除所述待处理的日志中的变量,所述变量为预先设置的参量;
将删除所述变量后的待处理的日志拆分为N个单词,生成所述待处理的日志的词袋,N为正整数。
3.根据权利要求2所述的日志的处理方法,其特征在于,所述预先设置的参量至少包括坏道的位置信息、坏道的编号信息、坏块的位置信息和坏块的编号信息中的任意一个。
4.根据权利要求3所述的日志的处理方法,其特征在于,所述删除所述待处理的日志中的变量,具体包括:
识别所述待处理的日志的正文部分的数字;
将所述待处理的日志的正文部分的数字删除。
5.根据权利要求1所述的日志的处理方法,其特征在于,所述第一关系为所述历史日志的词袋包含所述待处理的日志的词袋,所述第二关系为所述历史日志的词袋与所述待处理的日志的词袋相等,所述第三关系为所述待处理的日志的词袋包含所述历史日志的词袋,所述第四关系为所述待处理的日志的词袋与所述历史日志的词袋相交,所述第五关系为所述待处理的日志的词袋与所述历史日志的词袋独立。
6.根据权利要求1所述的日志的处理方法,其特征在于,在所述将所述待处理的日志的词袋与历史日志的词袋进行对比,确定所述待处理的日志的词袋与所述历史日志的词袋的关系之前,所述日志的处理方法还包括:
确定所述待处理的日志的词袋中未包括屏蔽词袋中的所有单词。
7.根据权利要求1至6中任一项所述的日志的处理方法,其特征在于,在处理完所有待处理的日志之后,所述日志的处理方法还包括:
获取保留的日志,将所述保留的日志作为参考日志,确定所述参考日志之间的相似度;
根据所述参考日志之间的相似度,对所述参考日志进行分类;其中,同一类的日志的相似度大于第一预设值;
确定每一类的日志的故障类别,以及每个所述参考日志的故障级别;
根据所述参考日志、所述参考日志的类别和所述参考日志的故障级别,生成映射文件,其中,所述映射文件用于分析后续接收的日志。
8.根据权利要求7所述的日志的处理方法,其特征在于,所述确定所述参考日志之间的相似度,具体包括:
在确定任意两个参考日志的相似度的过程中,分别进行以下操作:确定所述两个参考日志的词袋之间的相似度;将所述两个参考日志的词袋之间的相似度,作为所述两个参考日志之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网宿科技股份有限公司,未经网宿科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910211921.5/1.html,转载请声明来源钻瓜专利网。