[发明专利]基于分布式离线技术的电量数据批量高速处理方法及系统在审
申请号: | 201610880143.5 | 申请日: | 2016-10-09 |
公开(公告)号: | CN106502772A | 公开(公告)日: | 2017-03-15 |
发明(设计)人: | 蒋锦霞;朱青山;裴旭斌;戴波;王红凯;何东;闫娇娇 | 申请(专利权)人: | 国网浙江省电力公司信息通信分公司;国家电网公司;浙江华云信息科技有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F17/30 |
代理公司: | 浙江翔隆专利事务所(普通合伙)33206 | 代理人: | 王晓燕 |
地址: | 310007 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于分布式离线技术的电量数据批量高速处理方法及系统,涉及一种数据批处理方法及系统。目前,高速海量数据存储计算模型欠缺,未能满足不同种类、不同形式的海量数据存储、计算。本发明包括以下步骤1)电量采集前置机将采集电量实时发送到Kafka队列缓存;2)Storm集群读取Kafka队列电量信息,并实时存储到Hbase;3)Spark在Hbase中抽取需要处理的电量信息,并将其导入到Hive数据表;4)通过Spark离线计算操作相关Hive数据表得到当期电量,并对相关异常处理;本技术方案集Storm和Spark的优点,提升整体计算处理容量。从事务保障任务节点动态迁移技术,提出完整的任务节点迁移的事务保障协议,在确保迁移过程中流系统消息不丢包、不重复的同时,提高迁移本身的执行效率,提升系统稳定性。 | ||
搜索关键词: | 基于 分布式 离线 技术 电量 数据 批量 高速 处理 方法 系统 | ||
【主权项】:
基于分布式离线技术的电量数据批量高速处理方法,其特征在于包括以下步骤:a)电量采集前置机将采集电量实时发送到Kafka队列缓存;b)Storm集群读取Kafka队列电量信息,并实时存储到Hbase;c)Spark在Hbase中抽取需要处理的电量信息,并将其导入到Hive数据表;d)通过Spark离线计算操作相关Hive数据表得到当期电量,并对相关异常处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力公司信息通信分公司;国家电网公司;浙江华云信息科技有限公司,未经国网浙江省电力公司信息通信分公司;国家电网公司;浙江华云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610880143.5/,转载请声明来源钻瓜专利网。