[发明专利]基于完美哈希的日志解析方法及装置有效
申请号: | 201810050447.8 | 申请日: | 2018-01-18 |
公开(公告)号: | CN108228875B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 王天凤;王凯峰;王俏 | 申请(专利权)人: | 奇安信科技集团股份有限公司 |
主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/18;G06F16/14 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 100088 北京市西城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 完美 日志 解析 方法 装置 | ||
本发明实施例提供一种基于完美哈希的日志解析方法及装置。所述方法包括:获取待解析日志并根据预设规则对待解析日志进行信息提取,获取待解析日志的待解析关键字及对应的值;根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;根据各第一哈希值获得对应的待解析关键字类型,并将待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。所述装置用于执行所述方法。本发明实施例通过利用哈希查找的方法来识别待解析关键字,无需对待解析关键字字符的一一匹配,通过哈希查找即可快速得知关键字,从而提高了对日志解析的效率。
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种基于完美哈希的日志解析方法及装置。
背景技术
计算机系统中任何程序都有可能输出日志:操作系统内核、各种应用服务器等等。日志中包含了安全管理人员、运维人员和业务分析人员感兴趣的大量的信息,例如访问者的IP、访问的时间、来源的地址以及访问者所使用的客户端信息、分析用户行为特征等。
大多数日志为字符串,且固定位置表示一个固定的字段,以防火墙日志为例,这种字符串格式的日志无法满足防火墙日志内容在一定范围内变化的需求,故防火墙上使用键值对的方式发送日志,当监控装置接收到防火墙发送的日志后,传统的方法是使用字符串遍历找出每对键和值,获取到键后,通过关键字匹配获取关键字的类型,其中关键字匹配的时间与关键字的长度成正比,当关键字较多时,处理效率低下,严重影响了对防火墙日志的解析效率。
因此,如何提高对日志的解析效率是现如今亟待解决的课题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种基于完美哈希的日志解析方法及装置。
第一方面,本发明实施例提供一种基于完美哈希的日志解析方法,包括:
获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,获取所述待解析日志包含的至少一个待解析关键字及各待解析关键字对应的值;
根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;
根据各第一哈希值获得对应的待解析关键字类型,并将所述待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。
第二方面,本发明实施例提供一种基于完美哈希的日志解析装置,包括:
信息提取模块,用于获取待解析日志,并根据预设规则对所述待解析日志进行信息提取,获取所述待解析日志包含的至少一个待解析关键字及各待解析关键字对应的值;
计算模块,用于根据预先构建的完美哈希函数计算每一待解析关键字对应的第一哈希值;
解析模块,用于根据各第一哈希值获得对应的待解析关键字类型,并将所述待解析关键字对应的值存储到待解析关键字类型对应的结构中,以解析获得结构化数据。
第三方面,本发明实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面的方法步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,包括:
所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奇安信科技集团股份有限公司,未经奇安信科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810050447.8/2.html,转载请声明来源钻瓜专利网。