[发明专利]一种基于海量日志的实时关联分析方法及系统有效

专利信息
申请号: 202010637310.X 申请日: 2020-07-03
公开(公告)号: CN111858530B 公开(公告)日: 2022-08-16
发明(设计)人: 徐海青;周刚;陈是同;周晟;吴树霖;张江龙;陶俊;吴小华;高扬;毛舒乐;梁翀;浦正国;胡心颖;郭庆 申请(专利权)人: 国网福建省电力有限公司信息通信分公司;国网福建省电力有限公司;安徽继远软件有限公司;国网信息通信产业集团有限公司;国家电网有限公司
主分类号: G06F16/18 分类号: G06F16/18;G06F16/2458
代理公司: 合肥维可专利代理事务所(普通合伙) 34135 代理人: 吴明华
地址: 350003 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 海量 日志 实时 关联 分析 方法 系统
【权利要求书】:

1.一种基于海量日志的实时关联分析方法,其特征在于:包括:

获取原有日志事务数据DB的所有关联分析数据,所述关联分析数据包括数据DB中的不频繁项、频繁项和关联规则;

获取实时采集的日志数据db;

基于改进的Storm实时计算系统进行海量日志的实时关联分析,分析过程包括:

第一级节点启动,用于追踪流数据处理过程所有节点的任务完成情况,同时第二级节点启动,用于控制所有节点的工作顺序;

第二级节点向第三级节点发送日志数据db的标识字段;

第三级节点根据接收的标识字段读取数据库中对应的日志数据,并将读取数据发送到第四级节点;当第三级节点读取完成后,向所有第四级节点发送完成标志信息,同时将读取完的数据归入数据DB中;

第四级节点接收到数据后,统计所在节点上的所有事务中的项tij及每项频数,并转换成键值形式直接发送到第五级节点,第四级节点接收到所有第三级节点发送的完成标志信息后,向所有第五级节点发送完成标志信息;

第五级节点接收到所有第四级节点发送的完成标志信息后,对所在节点接收的所有键值对中相同的键进行合并,合并后发送到第六级节点;

第六级节点,接收所有第五级节点发送的键值对,进行键值对合并,获取日志数据db中的所有项tij及对应频数SUPk-itemset-l,获得日志数据db增加到DB中后新增的所有频繁项,形成待分析频繁项集合Glist;

第四级节点获取日志数据db和DB中所有与Glist中的项有关联的事务,并将所有与Glist中的项有关联的事务分组,每组事务传送到相同的第五级节点;

第五级节点对所在节点上接收的每组事务进行关联规则挖掘,并发送到第六级节点;

第六级节点接收所有第五级节点的关联规则,并与原有日志事务数据DB的关联规则融合,获取面向实时更新的数据DB和db的实时关联规则更新结果。

2.根据权利要求1所述的一种基于海量日志的实时关联分析方法,其特征在于:所述第四级节点获取日志数据db和DB中所有与Glist中的项有关联的事务,具体为:根据待分析频繁项集合Glist中的所有项,将日志数据db和DB中所有事务中的非Glist集合项删除,并合并相同的事务。

3.根据权利要求1所述的一种基于海量日志的实时关联分析方法,其特征在于:所述将所有与Glist中的项有关联的事务分组,具体为:

第六级节点形成待分析频繁项集合Glist后,根据预设分组组数,将Glist中的项分组,并分配对应分组号;

第四级节点利用其键值映射建立功能,建立频繁项集合Glist中的每一项和每一事务的一一映射关系,对应的,Glist中的每一项的分组号分享给与其映射的事务,获得 同一分组号下的事务集合。

4.根据权利要求1所述的一种基于海量日志的实时关联分析方法,其特征在于:所述原有日志事务数据DB和实时采集的日志数据db中,对于每一项是否为频繁项的判断基于预设的加权支持度区间(SUPL,SUPU)获取,对于SUPk-itemset-lSUPL的项tij存储在不频繁项候选集合PFZ1′中,SUPLSUPk-itemset-lSUPU的项tij存储在弱频繁项候选集合PF1′中,SUPk-itemset-lSUPU的项tij存储在强频繁项候选集合P1′中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网福建省电力有限公司信息通信分公司;国网福建省电力有限公司;安徽继远软件有限公司;国网信息通信产业集团有限公司;国家电网有限公司,未经国网福建省电力有限公司信息通信分公司;国网福建省电力有限公司;安徽继远软件有限公司;国网信息通信产业集团有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010637310.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top