[发明专利]一种URL日志存储方法及装置在审
申请号: | 201810097022.2 | 申请日: | 2018-01-31 |
公开(公告)号: | CN108304545A | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 魏方征;林子澜;汪庆权 | 申请(专利权)人: | 杭州迪普科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/12 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310051 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 日志 字段 预设 字段表 存储 存储空间 日志存储 替换 占用 查找 申请 | ||
本申请提供一种URL日志存储方法,所述方法包括:获取至少一条待存储的URL日志;对于任意一条URL日志,从所述URL日志中提取预设的URL日志字段所对应的字段值;在预设的URL日志字段表中查找所提取的字段值;在预设的URL日志字段表中查找到所提取的字段值的情况下,在预设的URL日志字段表中获取所提取的字段值所对应的代号,其中所获取的代号占用的存储空间小于所提取的字段值占用的存储空间;将所述URL日志中对应的字段值替换所获取的代号后,对经过替换的待存储的URL日志进行存储。
技术领域
本申请涉及计算机技术领域,尤其涉及一种URL日志存储方法及装置。
背景技术
URL(Uniform Resource Locator,统一资源定位符),其在用户访问Internet时发挥着极其重要的作用。随着互联网技术的高速发展,每天产生了大量的URL日志,例如常见的上网看新闻、查资料、网购、收发邮件、网页游戏等,这些行为都会产生大量的URL日志,而这些大量的URL日志往往需要存储在安全审计系统中,其中URL日志字段主要包括:访问时间、用户上网账号、用户IP地址、Web服务器IP地址、网站域名、网站URL、网站标题、网页标题等字段。由于URL日志数量庞大,特别是在需要存储所有URL日志的情况下,需要合理的存储方式将URL日志进行存储,否则可能会造成存储空间的浪费。
发明内容
有鉴于此,本申请提供一种URL日志存储方法及装置。
具体地,本申请是通过如下技术方案实现的:
一种URL日志存储方法,所述方法包括:
获取至少一条待存储的URL日志;
对于任意一条URL日志,从所述URL日志中提取预设的URL日志字段所对应的字段值;
在预设的URL日志字段表中查找所提取的字段值;
在预设的URL日志字段表中查找到所提取的字段值的情况下,在预设的URL日志字段表中获取所提取的字段值所对应的代号,其中所获取的代号占用的存储空间小于所提取的字段值占用的存储空间;
将所述URL日志中对应的字段值替换所获取的代号后,对经过替换的待存储的URL日志进行存储。
一种URL日志存储装置,所述装置包括:
日志获取单元,用于获取至少一条待存储的URL日志;
字段值提取单元,用于对于任意一条URL日志,从所述URL日志中提取预设的URL日志字段所对应的字段值;
字段值查找单元,用于在预设的URL日志字段表中查找所提取的字段值;
代号获取单元,用于在预设的URL日志字段表中查找到所提取的字段值的情况下,在预设的URL日志字段表中获取所提取的字段值所对应的代号,其中所获取的代号占用的存储空间小于所提取的字段值占用的存储空间;
日志存储单元,用于将所述URL日志中对应的字段值替换所获取的代号后,对经过替换的待存储的URL日志进行存储。
本申请通过分布式存储,即单独存储预设的URL日志字段所对应的字段值,对于重复的字段值只存储一份,URL日志中只存储对应的代号,解决了因URL日志数量过大造成存储空间浪费的问题,可以有效的节约存储空间。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本申请一示例性实施例示出的一种安全审计系统中URL日志统计示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州迪普科技股份有限公司,未经杭州迪普科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810097022.2/2.html,转载请声明来源钻瓜专利网。