[发明专利]一种日志压缩和索引方法有效
申请号: | 201710470489.2 | 申请日: | 2017-06-20 |
公开(公告)号: | CN109101504B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 孙清孟 | 申请(专利权)人: | 恒为科技(上海)股份有限公司 |
主分类号: | G06F16/174 | 分类号: | G06F16/174;G06F16/13;G06F16/14;G06F11/30 |
代理公司: | 上海三方专利事务所(普通合伙) 31127 | 代理人: | 吴玮 |
地址: | 201114 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种日志压缩和索引方法,1)日志数据特点分析;2)日志预处理;3)压缩算法组合;4)压缩数据索引;5)数据解压缩还原;6)条件查询,采用条件查询模块,其根据用户提供过的字段条件,输出满足字段条件的日志记录数据,实现日志的压缩和索引。本发明提供了一种日志压缩和索引方法,对日志的特点,进行预处理和可逆变换,使之成为更适合压缩的格式,综合运用各种压缩算法,达到最大压缩率的要求,且压缩后的数据便于查询,保证数据完整性、正确性。 | ||
搜索关键词: | 一种 日志 压缩 索引 方法 | ||
【主权项】:
1.一种高效的日志压缩和索引方法,其特征在于,包括以下步骤:1)日志数据特点分析,采用日志数据特点解析模块对日志自身的特点进行解析,包括对日志结构、日志字段数据类型、单字段重复及相似程度和字段间的关系约束等特点进行解析,输出解析结果;2)日志预处理,采用日志预处理模块根据日志分析模块输出的特点,对原始日志数据进行处理,处理内容包括排序、分列、分块及聚合,将数据各字段处理成重复或者相似度高的格式,使数据既能易于压缩,又不会增加检索查询的消耗,然后输出处理好的分块数据;3)压缩算法组合,采用压缩算法组合模块对日志数据进行初次压缩,通过机器学习的方式选择、排列出最优的编码和压缩算法,生成压缩算法组合表;4)压缩数据索引,对于需要查询的字段,压缩数据索引模块提供查询字段对应压缩数据的索引表;5)数据解压缩还原,数据解压缩还原模块根据索引表,对压缩结果进行逆向处理,还原出原始数据;6)条件查询,采用条件查询模块,其根据用户提供过的字段条件,输出满足字段条件的日志记录数据,实现日志的压缩和索引。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒为科技(上海)股份有限公司,未经恒为科技(上海)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710470489.2/,转载请声明来源钻瓜专利网。