[发明专利]一种基于海量日志的实时关联分析方法及系统有效
申请号: | 202010637310.X | 申请日: | 2020-07-03 |
公开(公告)号: | CN111858530B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 徐海青;周刚;陈是同;周晟;吴树霖;张江龙;陶俊;吴小华;高扬;毛舒乐;梁翀;浦正国;胡心颖;郭庆 | 申请(专利权)人: | 国网福建省电力有限公司信息通信分公司;国网福建省电力有限公司;安徽继远软件有限公司;国网信息通信产业集团有限公司;国家电网有限公司 |
主分类号: | G06F16/18 | 分类号: | G06F16/18;G06F16/2458 |
代理公司: | 合肥维可专利代理事务所(普通合伙) 34135 | 代理人: | 吴明华 |
地址: | 350003 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 海量 日志 实时 关联 分析 方法 系统 | ||
1.一种基于海量日志的实时关联分析方法,其特征在于:包括:
获取原有日志事务数据DB的所有关联分析数据,所述关联分析数据包括数据DB中的不频繁项、频繁项和关联规则;
获取实时采集的日志数据db;
基于改进的Storm实时计算系统进行海量日志的实时关联分析,分析过程包括:
第一级节点启动,用于追踪流数据处理过程所有节点的任务完成情况,同时第二级节点启动,用于控制所有节点的工作顺序;
第二级节点向第三级节点发送日志数据db的标识字段;
第三级节点根据接收的标识字段读取数据库中对应的日志数据,并将读取数据发送到第四级节点;当第三级节点读取完成后,向所有第四级节点发送完成标志信息,同时将读取完的数据归入数据DB中;
第四级节点接收到数据后,统计所在节点上的所有事务中的项tij及每项频数,并转换成键值形式直接发送到第五级节点,第四级节点接收到所有第三级节点发送的完成标志信息后,向所有第五级节点发送完成标志信息;
第五级节点接收到所有第四级节点发送的完成标志信息后,对所在节点接收的所有键值对中相同的键进行合并,合并后发送到第六级节点;
第六级节点,接收所有第五级节点发送的键值对,进行键值对合并,获取日志数据db中的所有项tij及对应频数SUPk-itemset-l,获得日志数据db增加到DB中后新增的所有频繁项,形成待分析频繁项集合Glist;
第四级节点获取日志数据db和DB中所有与Glist中的项有关联的事务,并将所有与Glist中的项有关联的事务分组,每组事务传送到相同的第五级节点;
第五级节点对所在节点上接收的每组事务进行关联规则挖掘,并发送到第六级节点;
第六级节点接收所有第五级节点的关联规则,并与原有日志事务数据DB的关联规则融合,获取面向实时更新的数据DB和db的实时关联规则更新结果。
2.根据权利要求1所述的一种基于海量日志的实时关联分析方法,其特征在于:所述第四级节点获取日志数据db和DB中所有与Glist中的项有关联的事务,具体为:根据待分析频繁项集合Glist中的所有项,将日志数据db和DB中所有事务中的非Glist集合项删除,并合并相同的事务。
3.根据权利要求1所述的一种基于海量日志的实时关联分析方法,其特征在于:所述将所有与Glist中的项有关联的事务分组,具体为:
第六级节点形成待分析频繁项集合Glist后,根据预设分组组数,将Glist中的项分组,并分配对应分组号;
第四级节点利用其键值映射建立功能,建立频繁项集合Glist中的每一项和每一事务的一一映射关系,对应的,Glist中的每一项的分组号分享给与其映射的事务,获得 同一分组号下的事务集合。
4.根据权利要求1所述的一种基于海量日志的实时关联分析方法,其特征在于:所述原有日志事务数据DB和实时采集的日志数据db中,对于每一项是否为频繁项的判断基于预设的加权支持度区间(SUPL,SUPU)获取,对于SUPk-itemset-lSUPL的项tij存储在不频繁项候选集合PFZ1′中,SUPLSUPk-itemset-lSUPU的项tij存储在弱频繁项候选集合PF1′中,SUPk-itemset-lSUPU的项tij存储在强频繁项候选集合P1′中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网福建省电力有限公司信息通信分公司;国网福建省电力有限公司;安徽继远软件有限公司;国网信息通信产业集团有限公司;国家电网有限公司,未经国网福建省电力有限公司信息通信分公司;国网福建省电力有限公司;安徽继远软件有限公司;国网信息通信产业集团有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010637310.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种连接气动冲床的料卷自动冲切机
- 下一篇:一种胶囊管道阀门