[发明专利]一种低开销的文件操作日志采集方法有效

专利信息
申请号: 201911303119.5 申请日: 2019-12-17
公开(公告)号: CN111159117B 公开(公告)日: 2023-07-04
发明(设计)人: 张为华;鲁云萍 申请(专利权)人: 复旦大学
主分类号: G06F16/17 分类号: G06F16/17;G06F16/18
代理公司: 上海科盛知识产权代理有限公司 31225 代理人: 杨宏泰
地址: 200433 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 开销 文件 操作 日志 采集 方法
【权利要求书】:

1.一种低开销的文件操作日志采集方法,其特征在于,包括以下步骤:

1)采用内核探针采集内核中的文件操作日志信息;

2)在内核空间设置一块用以写入内核探针采集到的信息的共享内存,用户空间从共享内存中读取内核探针采集到的信息;

3)通过去重算法减少日志数量,降低日志采集开销;

所述的步骤3)中,通过构建哈希表进行去重,哈希表中的键值均为结构体,哈希表中的键为文件操作日志中相同的部分,哈希表中的值即为去重后的日志信息;

去重算法包括过滤模块和合并模块,所述的过滤模块包括内核层过滤和用户层过滤,内核层过滤,通过进程pid进行过滤,用以实现对文件操作日志的过滤,用户层过滤用以实现对临时文件的过滤,所述的合并模块用以对文件读写操作进行合并,当对同一文件有多次读写操作时,则将多次连续读操作合并为一条读日志,将多次连续写操作合并为一条写日志;

对临时文件的过滤通过对文件名称进行过滤,包括后缀名为.swp和.tmp的临时文件。

2.根据权利要求1所述的一种低开销的文件操作日志采集方法,其特征在于,所述的步骤2)中,用户空间通过mmap机制实时从共享内存中读取内核探针采集到的信息。

3.根据权利要求1所述的一种低开销的文件操作日志采集方法,其特征在于,所述的合并模块的具体操作流程如下:

首先进行查找,查找该条日志信息是否存在于已有日志信息中,如果存在则进行合并,如果不存在,则在哈希表中插入该条日志信息。

4.根据权利要求1所述的一种低开销的文件操作日志采集方法,其特征在于,文件操作日志中相同的部分包括文件信息、进程信息和用户信息,具体包括进程ID、父进程ID、用户ID、文件名称和文件操作的类型。

5.根据权利要求1所述的一种低开销的文件操作日志采集方法,其特征在于,所述的哈希表的复杂度为O(1),解决哈希冲突采用链表法,哈希函数选择除法哈希法。

6.根据权利要求1所述的一种低开销的文件操作日志采集方法,其特征在于,所述的步骤1)中,在内核的虚拟文件层采用eBPF采集文件操作日志信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911303119.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top