[发明专利]一种基于电力大数据的负荷曲线并行聚类方法有效
申请号: | 201410312530.X | 申请日: | 2014-07-02 |
公开(公告)号: | CN104063480A | 公开(公告)日: | 2014-09-24 |
发明(设计)人: | 郑海雁;金农;顾国栋;丁晓;谢林枫;熊政;徐金玲;仲春林;方超;李昆明;季聪 | 申请(专利权)人: | 国家电网公司;江苏省电力公司;江苏方天电力技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电力 数据 负荷 曲线 并行 方法 | ||
技术领域
本发明涉及一种基于电力大数据的负荷曲线并行聚类方法,属于电力营销智能应用技术领域。
背景技术
电力营销、生产、调度等信息系统产生了海量的电力信息数据,仅江苏用采系统,每日需采集全省3000余万居民用户日负荷电量和20余万负控大用户的96点用电量数据,共计30多GB,自2006年以来积累的用电信息数据达39TB之多。江苏电力大数据时代已然来临,但如何驾驭如此海量的数据信息,从中获取有用的信息,挖掘潜在的价值,是江苏电力面临的挑战和机遇。
电力系统负荷建模是电力系统仿真分析的重要基础,负荷建模的准确性直接关系到仿真计算的可信度和精确性。负荷建模需要建立在对电力负荷特性充分分析的基础之上,而面对江苏省用电采集系统中海量的负荷数据,对每一个用户的负荷特性进行分析是不可能的,因此有必要对用户进行负荷聚类,根据聚类结果分析不同用户群的负荷特性。
K-means聚类算法简单易行,操作简便,是目前使用最为广泛的聚类方法之一。它首先选定一组初始聚类中心,通过迭代使得类间保持独立、类内保持紧密,迭代期间将聚类子集中所有数据样本的均值作为类的中心。目前K-means聚类算法在图形分割、客户分类、负荷聚类等领域得到了广泛的应用。
但在用电信息大数据的背景下,数以万亿的日负荷曲线需要进行聚类分析,传统的K-means聚类算法计算难以应付。目前主流的台式电脑、笔记本电脑cpu中均包含多个核心,因此可以充分利用现有的硬件资源,开发基于多核并行技术的K-means聚类算法,以加快负荷聚类的速度,提高负荷聚类的效率。
发明内容
本发明所要解决的技术问题是针对用电大数据背景下的负荷特性分析,提供一种基于多核并行技术的K-means聚类算法,用于提高负荷聚类的速度。
本发明为实现上述目的,采用如下技术方案:
一种基于电力大数据的负荷曲线并行聚类方法,包括如下步骤:
1)收集负荷曲线并进行筛选;
2)对负荷曲线进行归一化;
3)对负荷曲线进行去噪;
4)对负荷进行聚类分析;
5)对所述步骤4)K均值聚类得到的K类负荷聚类结果进行特征分析,摘取用电特征明显的聚类结果,计算所得各类曲线的聚类中心,对各类曲线的聚类中心进行二次分类,得到几种典型的负荷聚类结果。
前述的步骤1)中,数据收集与筛选是指从省用电采集系统库中抽取企业客户的96点负荷曲线,删除其中负荷数据不全和负荷容量为0的曲线,得到数据完整且情况正常的大客户负荷曲线。
前述的步骤2)中,负荷曲线归一化是指对所述步骤1)的每条负荷曲线进行遍历,找出96点中负荷最大的点,作为基准容量,进行曲线归一化,归一化公式如下:
P′i,j=Pi,j/Pi,max
其中:下标i表示负荷曲线编号,j表示每条负荷曲线中的负荷采集序号,Pi,j表示第i个用户在第j个采集点的负荷值,Pi,max表示第i个用户日负荷96点中的负荷最大值。
前述的步骤3)中,负荷去噪包括以下步骤:
3-1)选择小波函数并确定分解的层数,然后进行小波分解;
3-2)对各个分解尺度下的高频系数选择一个阈值进行软阈值量化处理;
3-3)根据小波分解的各层频域系数进行负荷曲线的小波重构,得到去噪后的负荷曲线。
前述的步骤3-1)中,小波函数选定Daubechies小波系中的‘dN4’,分解层数为3层。
前述的步骤4)中,采用基于多核并行技术的K均值聚类算法进行负荷曲线的聚类分析,包括以下步骤:
4-1)检测当前电脑CPU的核心数n,激活所有核心,准备进行计算;
4-2)对所述步骤3)的去噪后的负荷曲线进行相异度分析,找出相异度最大的K条负荷曲线,作为并行K-means聚类算法的初始聚类中心;
4-3)将所有负荷曲线等分成n份,交给当前电脑的n个核心,分别与K个聚类中心进行相似度计算,并将负荷曲线归入相似度最高的作为聚类中心的负荷曲线那一类中;
4-4)所有负荷曲线全部分类完成后,计算并更新各类别当前的聚类中心,检查当前所有聚类中心与上一次迭代得到的聚类中心差值是否均小于预设阀值,若是,则进入步骤4-5),否则,转入步骤4-3);
4-5)聚类结束,关闭并行计算进程,释放内存,显示聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;江苏省电力公司;江苏方天电力技术有限公司,未经国家电网公司;江苏省电力公司;江苏方天电力技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410312530.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:适用于瓦片地图服务的海洋环境预报产品并行处理方法
- 下一篇:样本数据收集系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置