[发明专利]一种电网时序大数据并行加载方法有效

专利信息
申请号: 201410566127.X 申请日: 2014-10-22
公开(公告)号: CN104407879B 公开(公告)日: 2018-02-02
发明(设计)人: 王远;袁军;包建国;胡健;张珂珩 申请(专利权)人: 江苏瑞中数据股份有限公司
主分类号: G06F9/445 分类号: G06F9/445
代理公司: 南京知识律师事务所32207 代理人: 汪旭东
地址: 210003 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种电网时序大数据并行加载方法,以解决多客户端并行加载海量历史时序数据时遇到的不能并行加载而产生等待现象的问题。本发明通过对索引映射表做分区处理、根据待加载的数据量的大小对历史时序数据存储表做分区预处理、根据各数据节点上所分配的历史时序数据存储表分区的范围,对待加载的海量历史时序数据做保持数据局部性的处理,经过上述处理后能够有效减少并行加载海量历史时序数据时多客户端读写索引映射表文件遇到的磁盘IO冲突和集群不同节点之间网络通信开销,避免单节点加载海量历史时序数据时负载过重带来的性能问题。本方法能充分利用分布式并行处理能力,大大减少海量历史时序数据加载的时间。
搜索关键词: 一种 电网 时序 数据 并行 加载 方法
【主权项】:
一种电网时序大数据并行加载方法,其特征在于,包括如下步骤:1)分区处理:对索引映射表文件进行分区处理,将索引映射表文件根据集群及测点规模的情况分为多个分区,利用HBase的分区管理功能,将这多个分区随机均衡的分配给若干个数据节点;对历史数据存储表进行分区预处理,根据集群数据节点个数、待加载的数据量大小及集群分区配置文件的大小,将历史数据存储表预分为多个分区,利用HBase的分区管理功能,将这多个分区随机均衡分配给集群数据节点;2)保持数据局部性及并行加载:将所有的测点名写入到索引映射表文件中;读取各数据节点所管理的历史数据存储表的分区及每个分区所对应的索引映射表的范围,对待加载的数据进行切分处理;把属于同一个数据节点的历史数据的切分合并后分发到其所对应的数据节点;在每个数据节点上启动一个客户端并行加载这些历史时序数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏瑞中数据股份有限公司,未经江苏瑞中数据股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410566127.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top