[发明专利]一种大数据场景下的日志分布式流式采集及计算方法在审
申请号: | 202110927267.5 | 申请日: | 2021-08-13 |
公开(公告)号: | CN113656369A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 丁武;胡泉;李林 | 申请(专利权)人: | 辽宁华盾安全技术有限责任公司 |
主分类号: | G06F16/18 | 分类号: | G06F16/18;G06F16/2455;G06F16/2458 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 110000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 场景 日志 分布式 采集 计算方法 | ||
本申请涉及数据处理领域,揭露一种大数据场景下的日志分布式流式采集及计算方法、装置、电子设备及存储介质,所述方法包括:采集流数据,根据构建流数据的有向图,配置流数据的流分区;根据流分区,对流数据进行任务转换,生成多个任务算子,计算每个任务算子的运行数据;若运行数据在运行过程不需要逻辑转换,采用直发模式将运行数据传输到下游任务算子,使运行数据处于同一流分区,汇总处于同一流分区的运行数据,得到最终输出数据;若运行数据在运行过程需要逻辑转换,采用重新分发模式将运行数据传输到逻辑转换对应的任务算子,使运行数据处于不同流分区,汇总处于不同流分区的运行数据,得到最终输出数据。本申请可以提高流数据的处理效率。
技术领域
本申请涉及数据处理领域,尤其涉及一种大数据场景下的日志分布式流式采集及计算方法、装置、电子设备以及计算机可读存储介质。
背景技术
在当前的互联网用户、设备以及服务等激增的时代下,不同业务场景都会有着大量的持续数据产生,即产生大量的流数据,而面对大量产生的流数据,如何实时高效的计算处理这些流数据显得愈发重要。
目前,通常采用数据计算框架(如Map Reduce,Storm,Spark等)去计算处理这些实时产生的流数据,但是在实际业务场景中,由于数据的错综复杂以及用户需求的多变性导致在利用这些数据计算框架处理流数据时,无法快速响应业务场景的需求,从而导致对流数据的处理效率不高。
申请内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种大数据场景下的日志分布式流式采集及计算方法、装置、电子设备以及计算机可读存储介质,可以提高流数据的处理效率。
第一方面,本申请提供了一种大数据场景下的日志分布式流式采集及计算方法,包括:
采集流数据,并构建所述流数据的有向图,根据所述有向图,配置所述流数据的流分区;
根据所述流分区,利用操作算子对所述流数据进行任务转换,生成多个任务算子,并计算每个所述任务算子的运行数据;
识别所述运行数据在运行过程中是否需要逻辑转换;
若所述运行数据在运行过程中不需要逻辑转换,则采用直发模式将所述运行数据传输到下游任务算子中,以使所述运行数据处于同一流分区,并汇总处于同一流分区的运行数据,得到最终输出数据;
若所述运行数据在运行过程中需要逻辑转换,则采用重新分发模式将所述运行数据传输到所述逻辑转换对应的任务算子中,以使所述运行数据处于不同流分区,并汇总处于不同流分区的运行数据,得到最终输出数据。
可以看出,本申请实施例首先通过构建采集的流数据的有向图,根据所述有向图,配置所述流数据的流分区,可以确定所述流数据在数据处理过程中数据之间的流向和关系,并将所述有向图中具有相同流向的数据进行归并至同一区域进行处理,保障后续流数据在处理过程中的一致性,提高后续流数据的处理速度;其次,根据所述流分区,利用操作算子对所述流数据进行任务转换,生成多个任务算子,可以确定所述流数据中每个数据在所述流分区的处理操作,从而可以快速响应后续应用程序的计算处理,并计算每个所述任务算子的运行数据,可以获取每个所述任务算子的输出结果;进一步地,本申请实施例通过识别每个所述运行数据在运行过程中是否需要逻辑转换,可以确定后续每个运行数据的处理区间是否处于同一流分区,从而采用直发模式或重新分发模式去处理流数据的计算,提高流数据的处理效率。
在第一方面的一种可能实现方式中,所所述构建所述流数据的有向图,包括:
将所述流数据中每个数据作为图元素节点,采用深度优先算法遍历所述图元素节点中所有元素节点的节点路径;
根据所述节点路径,确定所述图元素节点的邻接列表;
根据所述邻接列表,生成所述流数据的有向图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁华盾安全技术有限责任公司,未经辽宁华盾安全技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110927267.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:交通图像数据处理系统
- 下一篇:一种航母用耐火铠装电缆生产装备及其生产工艺
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置