[发明专利]流式处理电表数据的聚合统计方法、装置、设备及介质在审
申请号: | 202010651220.6 | 申请日: | 2020-07-08 |
公开(公告)号: | CN111797087A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 刘军;马跃华;吕庆锋 | 申请(专利权)人: | 深圳天顺智慧能源科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/242;G06F16/2455;G06F16/2458;G06Q50/06 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 蒋学超 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 电表 数据 聚合 统计 方法 装置 设备 介质 | ||
本发明公开了一种流式处理电表数据的聚合统计方法、装置、设备及介质,其中方法包括以下步骤:搭建Nginx集群采集电表数据;将采集的电表数据导入kafka集群中;通过Spark Streaming对kafka集群中的电表数据进行批处理;批处理后利用Spark进行数据清洗和聚合统计;将统计结果存入AWS Redshift中。本发明提高了电力数据处理的效率,使数据更好、更快的展现,具有高强度的容错性和实时性。
技术领域
本发明涉及电力领域,更具体地说是一种流式处理电表数据的聚合统计方法、装置、设备及介质。
背景技术
物联网技术和信息技术的飞速发展导致了信息资源的急剧增长,数据源产生的数据越来越多,处理数据的实时性需求越来越大,而物联网传来的海量电力相关的数据的统计、监测、管理是负荷能效管理系统、能量管理系统,综合能源管理系统等电力系统中不可或缺的部分,主要为摸清能源状态、管住能耗指标、提出节能减排措施等服务,那么实时的、稳定的、直观的统计数据的展现显得尤其重要。
发明内容
本发明的目的在于克服现有技术的不足,提供流式处理电表数据的聚合统计方法、装置、设备及介质。
为实现上述目的,本发明采用以下技术方案:
第一方面,流式处理电表数据的聚合统计方法,所述方法包括:
搭建Nginx集群采集电表数据;
将采集的电表数据导入kafka集群中;
通过Spark Streaming对kafka集群中的电表数据进行批处理;
批处理后利用Spark进行数据清洗和聚合统计;
将统计结果存入AWS Redshift中。
其进一步技术方案为:所述搭建Nginx集群采集电表数据步骤中,所述电表数据分为实时数据和补发数据,所述实时数据和补发数据采用不同的topic区分处理。
其进一步技术方案为:所述通过Spark Streaming对kafka集群中的电表数据进行批处理的步骤,具体包括以下步骤:
初始化创建StreamingContext对象;
以Receiver方式和kakfa集群进行整合并将电表数据分成多个数据块存放在内存里;
在间隔时间内对内存中的数据块进行批处理。
其进一步技术方案为:所述以Receiver方式和kakfa集群进行整合并将电表数据分成多个数据块存放在内存里的步骤中,所述内存为Spark Executor的内存。
第二方面,流式处理电表数据的聚合统计装置,所述装置包括搭建单元、导入单元、批处理单元、统计单元以及保存单元;
所述搭建单元,用于搭建Nginx集群采集电表数据;
所述导入单元,用于将采集电表数据导入kafka集群中;
所述批处理单元,用于通过Spark Streaming对kafka集群中的电表数据进行批处理;
所述统计单元,用于批处理后利用Spark进行数据清洗和聚合统计;
所述保存单元,用于将统计结果存入AWS Redshift中。
其进一步技术方案为:所述批处理单元包括初始化模块、划分模块以及批处理模块;
所述初始化模块,初始化创建StreamingContext对象;
所述划分模块,用于以Receiver方式和kakfa集群进行整合并将电表数据分成多个数据块存放在内存里;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳天顺智慧能源科技有限公司,未经深圳天顺智慧能源科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010651220.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于盐雾环境的耐高温光伏电缆
- 下一篇:显示控制设备和显示面板模块
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置