[发明专利]一种文件采集方法及装置在审
申请号: | 201810181875.4 | 申请日: | 2018-03-06 |
公开(公告)号: | CN108304583A | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 陈晓峰 | 申请(专利权)人: | 北京顶象技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 赵志远 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件采集 采集 索引标识 日志文件 文件切换 采集间隔 预设 方法和装置 日志采集 数据丢失 现有文件 自动采集 | ||
本发明提供了一种文件采集方法及装置,涉及日志文件自动采集技术领域。所述文件采集方法首先获取第一文件,提取第一文件的第一索引标识信息,以及获取上次进行文件采集时提取的第二文件的第二索引标识信息,然后基于第一索引标识信息和第二索引标识信息,判断文件采集对象是否在预设采集间隔时间内从第二文件切换至第一文件,在为否时,采集第一文件,并在文件采集对象在预设采集间隔时间内从第二文件切换至第一文件时,对第二文件的未采集部分和第一文件进行采集。所述日志采集方法和装置通过对文件切换前未采集的日志文件部分进行采集,解决了现有文件采集方法中日志文件采集不完整、部分数据丢失的问题。
技术领域
本发明涉及日志文件自动采集技术领域,具体而言,涉及一种文件采集方法及装置。
背景技术
现代企业甚至是个人都有越来越多的信息需要进行收集和统计,而传统的纸笔记录方式已经无法满足如今数量巨大的收录条目。因此,随着计算机技术和网络技术的迅速发展,无论是个人还是企业都开始使用计算机通过日志采集指定的有用信息,除此之外,在应用系统中,日志也是不可或缺的重要组成部分,对Java等应用程序的运行和调试起着重要作用。
但是现有的日志采集方法大多在预设时间会进行日志切换,日志切换时间和日志文件采集时间发生冲突时会造成日志文件采集不完整、部分数据丢失的问题。
发明内容
有鉴于此,本发明实施例的目的在于提供一种文件采集及装置,以解决上述现有日志文件采集方法存在的日志文件采集不完整、部分数据丢失的问题。
第一方面,本发明实施例提供了一种文件采集方法,所述文件采集方法首先获取第一文件,提取所述第一文件的第一索引标识信息,以及获取上次进行文件采集时提取的第二文件的第二索引标识信息,然后基于所述第一索引标识信息和所述第二索引标识信息,判断文件采集对象是否在预设采集间隔时间内从所述第二文件切换至所述第一文件,在为否时,采集所述第一文件。
综合第一方面,在基于所述第一索引标识信息和所述第二索引标识信息,判断文件采集对象是否在采集间隔时间内从所述第二文件切换至所述第一文件之后,所述方法还包括:在为是时,判断所述第二文件是否存在未采集部分,在所述第二文件存在未采集部分时采集所述第二文件的未采集部分和所述第一文件。
综合第一方面,所述采集所述第一文件,包括:采集所述第一文件的文件内容信息以及与本次文件采集对应的采集位置记录信息;所述采集所述第二文件的未采集部分和所述第一文件,包括:采集所述第二文件的未采集部分和所述第一文件的文件内容信息以及与本次文件采集对应的采集位置记录信息。
综合第一方面,所述判断所述第二文件是否存在未采集部分,包括:提取上次进行文件采集时采集的所述第二文件的采集位置记录信息;判断所述采集位置记录信息是否指向所述第二文件的末尾;其中,在为是时,表明所述第二文件不存在未采集部分;在为否时,表明所述第二文件存在未采集部分。
综合第一方面,所述基于所述第一索引标识信息和所述第二索引标识信息,判断文件采集对象是否在采集间隔时间内从所述第二文件切换至所述第一文件,包括:判断所述第一索引标识信息和所述第二索引标识信息是否相同,获得判断结果;基于所述判断结果,判断文件采集对象是否在采集间隔时间内从所述第二文件切换至所述第一文件,其中:在所述判断结果为是时,表明所述文件采集对象在所述预设采集间隔时间内未从所述第二文件切换至所述第一文件;在所述判断结果为否时,表明所述文件采集对象在所述预设采集间隔时间内从所述第二文件切换至所述第一文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京顶象技术有限公司,未经北京顶象技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810181875.4/2.html,转载请声明来源钻瓜专利网。