[发明专利]一种低开销的文件操作日志采集方法有效
申请号: | 201911303119.5 | 申请日: | 2019-12-17 |
公开(公告)号: | CN111159117B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 张为华;鲁云萍 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F16/17 | 分类号: | G06F16/17;G06F16/18 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 开销 文件 操作 日志 采集 方法 | ||
1.一种低开销的文件操作日志采集方法,其特征在于,包括以下步骤:
1)采用内核探针采集内核中的文件操作日志信息;
2)在内核空间设置一块用以写入内核探针采集到的信息的共享内存,用户空间从共享内存中读取内核探针采集到的信息;
3)通过去重算法减少日志数量,降低日志采集开销;
所述的步骤3)中,通过构建哈希表进行去重,哈希表中的键值均为结构体,哈希表中的键为文件操作日志中相同的部分,哈希表中的值即为去重后的日志信息;
去重算法包括过滤模块和合并模块,所述的过滤模块包括内核层过滤和用户层过滤,内核层过滤,通过进程pid进行过滤,用以实现对文件操作日志的过滤,用户层过滤用以实现对临时文件的过滤,所述的合并模块用以对文件读写操作进行合并,当对同一文件有多次读写操作时,则将多次连续读操作合并为一条读日志,将多次连续写操作合并为一条写日志;
对临时文件的过滤通过对文件名称进行过滤,包括后缀名为.swp和.tmp的临时文件。
2.根据权利要求1所述的一种低开销的文件操作日志采集方法,其特征在于,所述的步骤2)中,用户空间通过mmap机制实时从共享内存中读取内核探针采集到的信息。
3.根据权利要求1所述的一种低开销的文件操作日志采集方法,其特征在于,所述的合并模块的具体操作流程如下:
首先进行查找,查找该条日志信息是否存在于已有日志信息中,如果存在则进行合并,如果不存在,则在哈希表中插入该条日志信息。
4.根据权利要求1所述的一种低开销的文件操作日志采集方法,其特征在于,文件操作日志中相同的部分包括文件信息、进程信息和用户信息,具体包括进程ID、父进程ID、用户ID、文件名称和文件操作的类型。
5.根据权利要求1所述的一种低开销的文件操作日志采集方法,其特征在于,所述的哈希表的复杂度为O(1),解决哈希冲突采用链表法,哈希函数选择除法哈希法。
6.根据权利要求1所述的一种低开销的文件操作日志采集方法,其特征在于,所述的步骤1)中,在内核的虚拟文件层采用eBPF采集文件操作日志信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911303119.5/1.html,转载请声明来源钻瓜专利网。