[发明专利]一种基于spark技术的配电网海量数据的处理及分析方法在审
申请号: | 202010577545.4 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111782680A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 黄宸希;韩韬;何鸣一;王智琦;吴雪琼;孙保华;孙聪聪;冯荣强;赵磊;唐伟;王必恒 | 申请(专利权)人: | 国电南瑞南京控制系统有限公司;南瑞集团有限公司;南瑞智能配电技术有限公司;国电南瑞科技股份有限公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/25;G06F40/154;G06F16/903 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 spark 技术 配电网 海量 数据 处理 分析 方法 | ||
1.一种基于spark技术的配电网海量数据的处理及分析方法,其特征在于,包含以下步骤:
(1)对配电网设备地理信息与拓扑信息文件使用正则表达式进行信息提取及存储;
(2)将提取的信息由半结构化数据转为结构化数据;
(3)对结构化数据进行构建;
(4)基于spark技术对构建的数据进行存储并转换为计算机可识别的代码,进行数据展示。
2.根据权利要求1所述基于spark技术的配电网海量数据的处理及分析方法,其特征在于,步骤(1)包括如下步骤:
(a)对配电网设备地理信息与拓扑信息文件进行分析,了解文件的基本格式;
(b)从文件中根据正则表达式提取出拓扑信息及设备经纬度信息;
(c)将提取出的拓扑信息及设备经纬度信息数据进行存储。
3.根据权利权利要求2所述基于spark技术的配电网海量数据的处理及分析方法,其特征在于:所述文件为CIM模型文件。
4.根据权利要求1所述基于spark技术的配电网海量数据的处理及分析方法,其特征在于,步骤(2)具体包括如下步骤:
(a)简化提取的配电网拓扑结构;
(b)以节点为索引建立设备之间的连接关系;
(c)将设备之间的连接关系转换为对应的拓扑关系数据表。
5.根据权利要求1所述基于spark技术的配电网海量数据的处理及分析方法,其特征在于,步骤(3)具体包括如下步骤:将结构化数据转换为表格形式数据并进行数据持久化。
6.根据权利要求1所述基于spark技术的配电网海量数据的处理及分析方法,其特征在于,步骤(4)具体包括如下步骤:
(a)将构建的数据集进行分块并存储于集群中的不同节点;
(b)将构建的数据转换为计算机可识别的代码;
(c)进行数据展示。
7.根据权利要求6所述基于spark技术的配电网海量数据的处理及分析方法,其特征在于,步骤(a)中,所述存储方式为RDD方式。
8.根据权利要求6所述基于spark技术的配电网海量数据的处理及分析方法,其特征在于,步骤(a)包括如下步骤:
(a)将原始数据集按照区域进行切分,分成不同的数据块;
(b)将不同的数据块存储于不同的集群节点内存中。
9.根据权利要求6所述基于spark技术的配电网海量数据的处理及分析方法,其特征在于,步骤(b)中,转换为计算机可识别的代码后,将计算机可识别的代码进行合并简化。
10.一种基于spark技术的配电网海量数据的处理及分析系统,其特征在于:包括数据存储模块、数据处理模块和数据展示模块,数据处理模块用于将配电网设备地理信息与拓扑信息提取、由半结构化数据转为结构化数据并进行数据构建,数据存储模块用于对数据进行存储,所述数据展示模块用于从数据存储模块提取数据并进行展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国电南瑞南京控制系统有限公司;南瑞集团有限公司;南瑞智能配电技术有限公司;国电南瑞科技股份有限公司,未经国电南瑞南京控制系统有限公司;南瑞集团有限公司;南瑞智能配电技术有限公司;国电南瑞科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010577545.4/1.html,转载请声明来源钻瓜专利网。