[发明专利]保存和分析日志数据的系统和方法有效
申请号: | 202010192207.9 | 申请日: | 2020-03-18 |
公开(公告)号: | CN111488439B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 林元雁;左虹 | 申请(专利权)人: | 杭州迪普科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F11/34;G06F16/31;G06F16/33 |
代理公司: | 北京金讯知识产权代理事务所(特殊普通合伙) 11554 | 代理人: | 黄剑飞 |
地址: | 310051 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 保存 分析 日志 数据 系统 方法 | ||
本公开提供一种保存和分析日志数据的系统,该系统包括:日志数据压缩转换部分,用于将日志数据中出现或使用高频次数据使用转换函数将其进行数据压缩后获得新的日志数据结构并存储;日志分析部分,利用指定算法对转换后的日志数据进行重新排列、迭代访问以及排序;以及日志数据解压缩还原部分,利用日志数据压缩转换部分所使用的算法变换的逆变换来还原原始日志数据。本公开通过一种优化存储结构,利用哈希表存储日志,可以大大减少对业务日志的处理时间,解决了大数据的查询和分析的优化问题。
技术领域
本公开涉及保存和分析日志数据的系统和方法,尤其涉及以优化日志存储结构保存和分析日志数据的系统和方法。
背景技术
业务日志作为安全产品的重要组成部分,可以利用它的信息帮助我们有效地管理网络,提高网络安全性。
现有的日志基本都是数据库或者日志文件存储方式,数据库在建表中添加对应的日志字字段并通过数据库语句写入文件,日志文件通过指定的日志格式写入文件。分析日志时按照需求不断解析日志文件并加以统计。
数据库相比文件系统要复杂的多,自然开销也要大些,在大数据的情况下数据库存储的方式并不合适。在文件系统中,访问文件非常简单,相比于数据库开销小,但是在旧有的日志格式下,大数据处理日志信息加以分析效率低下。
无论是解析日志还是查询分析,每次都要重复大量的工作,且每次不同的分析需求都要重新解析查询统计,浪费性能且开销较大。
因此,需要一种技术方案来减少对业务日志的处理时间,从而解决大数据查询和分析的优化问题。
发明内容
本公开就是针对上述技术问题而提出的技术方案。本发明目的是通过一种优化存储结构,利用哈希表存储日志,以减少对业务日志的处理时间,以及大数据的查询和分析的优化问题。本公开通过将原始日志数据转换为新的数据类型,使得转换后的日志数据量减少,以便减少后续日志分析额外的转换支出,并提升对比查询的效率,并且利用多种多样的算法来在各种场景下对转换后的日志数据进行有效处理与分析。
根据本公开的一个方面,提供了一种保存和分析日志数据的系统,该系统包括:日志数据压缩转换部分,用于将日志数据中出现或使用高频次数据使用转换函数将其进行数据压缩后获得新的日志数据结构并存储;日志分析部分,利用指定算法对转换后的日志数据进行重新排列、迭代访问以及排序;以及日志数据解压缩还原部分,利用日志数据压缩转换部分所使用的算法变换的逆变换来还原原始日志数据。
根据本公开的保存和分析日志数据的系统,其中所述日志数据中出现或使用高频次数据包括IP地址或IPv地址。
根据本公开的保存和分析日志数据的系统,其中所述日志数据压缩转换部分将日志和时间统一转换为计算机时间格式,并且将其他端口或者数字直接转化成整数型。
根据本公开的保存和分析日志数据的系统,其中所述日志数据压缩转换部分对于有特定规律特定字符信息仅比较其首个字母并通过内部定义的索引号进行转换。
根据本公开的保存和分析日志数据的系统,其中所述日志数据压缩转换部分对于无规则超长字符串使用CMap将其转换为哈希值来进行索引。
根据本公开的保存和分析日志数据的系统,其中所述数据类型的选择利用函数库来驱动。
根据本公开的保存和分析日志数据的系统,其中所述日志分析部分使用算法stable sort来以指定规则重新排列指定范围内的元素,并保留相等元素之间的顺序关系;使用算法for each来用指定函数依次对指定范围内所有元素进行迭代访问;并且使用哈希表map和他的迭代器iterator统计某一列中字符串出现的次数并支持排序功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州迪普科技股份有限公司,未经杭州迪普科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010192207.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车辆电源系统的管理方法、装置及电子设备
- 下一篇:一种组装式喉罩
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置