[发明专利]一种电力信息系统海量日志数据实时处理系统在审
申请号: | 202010029975.2 | 申请日: | 2020-01-13 |
公开(公告)号: | CN111209314A | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 何东;饶涵宇;张辰;董媛媛;吴小华;徐海青;徐唯耀;陈是同;张彬彬;胡心颖;郭庆;吴立刚;浦正国;胡丁丁 | 申请(专利权)人: | 国网浙江省电力有限公司信息通信分公司;安徽继远软件有限公司;国网信息通信产业集团有限公司;国家电网有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/23;G06F16/27;G06F9/54 |
代理公司: | 合肥维可专利代理事务所(普通合伙) 34135 | 代理人: | 吴明华 |
地址: | 310007 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电力 信息系统 海量 日志 数据 实时处理 系统 | ||
1.一种电力信息系统海量日志数据实时处理系统,其特征在于:包括:
接收数据模块,用于接收采集到的海量日志数据;
融合存储模块,用于将海量日志数据存储到HBase数据库中;
数据加载模块,用于数据存储和数据查询过程的实时加载;
实时分析处理模块,采用Storm框架技术实时计算海量数据;
数据快速查询检索模块,包括查询请求获取模块,关联规则建立模块和查询结果显示模块,所述查询请求获取模块用于获取用户输入的查询关键字;所述关联规则建立模块基于Storm框架技术并行处理数据,建立数据之间的关联;所述查询结果显示模块将查询结果输出到用户端。
2.根据权利要求1所述的一种电力信息系统海量日志数据实时处理系统,其特征在于:所述融合存储模块,基于Storm分布式流式处理技术将海量日志数据存储到HBase数据库中。
3.根据权利要求1或2所述的一种电力信息系统海量日志数据实时处理系统,其特征在于:所述融合存储模块中包括内存映射文件,用于存储数据文件到数据文件所在内存地址的映射关系。
4.根据权利要求1所述的一种电力信息系统海量日志数据实时处理系统,其特征在于:所述数据加载模块,在数据存储过程采用Kafka消息队列技术将海量数据实时存储到HBase数据库中,在数据查询过程中采用Impala技术从HBase数据库快速获取查询结果。
5.根据权利要求1所述的一种电力信息系统海量日志数据实时处理系统,其特征在于:所述实时分析处理模块,基于Storm框架技术从数据加载模块中获取加载的数据,转换成Storm中的Topology对象,Storm中的调度中心Nimbus接收Topology对象,并将Topology对象分配到不同Supervisor的不同Worker并行执行任务。
6.根据权利要求1所述的一种电力信息系统海量日志数据实时处理系统,其特征在于:所述关联规则建立模块,具体为:
6.1、对于原始数据库D和新增数据库d中的日志数据经过预处理后,按照日志事件发生时间排列,并通过预设时间间隔的滑动时间窗口,将所有日志事件划分成多项;
6.2、对于原始数据库和新增数据库中的每一项遍历,过滤掉出现次数小于预设值的项,得到原始数据库的所有频繁项组成的频繁项集FD和新增数据库中的所有频繁项组成的频繁项集Fd;
6.3、对于集合FD和Fd取交集,得到集合C1为原始数据库和新增数据库中都频繁出现的项,取FD和C1的差集,得到在原始数据库中频繁发生,而在新增数据库中不频繁发生的频繁项集合C21,取Fd和C1的差集,得到在原始数据库中不频繁发生,而在新增数据库中频繁发生的频繁项集合C31;
6.4、针对频繁项集合C2,在新增数据库中遍历获取每项出现的次数,结合集合C2中的每一项在原始数据库中出现的次数,得到每项出现的总次数;
针对频繁项集合C3,在原始数据库中遍历获取每项出现的次数,结合集合C3中的每一项在新增数据库中出现的次数,得到每项出现的总次数;
6.5、针对频繁项集合C2,过滤掉出现总次数小于预设值的项,得到新的频繁项集合C22;针对频繁项集合C3,过滤掉出现总次数小于预设值的项,得到新的频繁项集合C32;
6.6、合并集合C1、C22和C32得到原始数据库和新增数据库形成的更新数据库的频繁项集合FDd,集合FDd中的每一项中包含的日志事件即为有关联的事件。
7.根据权利要求6所述的一种电力信息系统海量日志数据实时处理系统,其特征在于:所述查询结果显示模块,通过获取到的查询关键字,在频繁项集合FDd中遍历获取包含关键字的日志事件及其关联事件,得到所查询的日志事件的前因后果事件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司信息通信分公司;安徽继远软件有限公司;国网信息通信产业集团有限公司;国家电网有限公司,未经国网浙江省电力有限公司信息通信分公司;安徽继远软件有限公司;国网信息通信产业集团有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010029975.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水利工程施工用混凝土浇筑设备
- 下一篇:晶圆承载装置