[发明专利]一种基于改进k-means算法的海量智能用电数据分析方法有效
申请号: | 201510263237.3 | 申请日: | 2015-05-21 |
公开(公告)号: | CN104850629A | 公开(公告)日: | 2015-08-19 |
发明(设计)人: | 周天和;卢晓飞;张元元;蔡荣 | 申请(专利权)人: | 杭州天宽科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州之江专利事务所(普通合伙) 33216 | 代理人: | 张慧英 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 means 算法 海量 智能 用电 数据 分析 方法 | ||
1.一种基于改进k-means算法的海量智能用电数据分析方法,其特征在于包括如下步骤:(1)对家庭用户建立Map-Reduce并行处理模型,并以Map-Reduce并行处理模型为数据对象创建海量智能用电数据分析架构;
(2)利用改进k-means算法,基于对象密度的大小、簇间距离、簇内对象的分散程度选择初始聚类中心及聚类个数k;
(3)在Map-Reduce并行处理模型下对初始聚类中心进行优化,准确定位聚类中心;
(4)对每个聚类的簇所属的数据进行并行挖掘,完成用电数据分析。
2.根据权利要求1所述的一种基于改进k-means算法的海量智能用电数据分析方法,其特征在于:所述步骤(1)的Map-Reduce并行处理模型包括家庭用户用电信息的家庭用户号、房屋面积、家庭成员数、每天用电量、峰谷电量、家用电器数六种数据。
3.根据权利要求1所述的一种基于改进k-means算法的海量智能用电数据分析方法,其特征在于:所述步骤(1)的海量智能用电数据分析架构采用主/从架构模式,包括数据源、云计算主控服务器与云计算从服务器;云计算主控服务器接收数据源的海量用点数据并对用点数据的维度进行定义,云计算从服务器对云计算主控服务器定义后的用电数据进行并行挖掘算法计算。
4.根据权利要求1所述的一种基于改进k-means算法的海量智能用电数据分析方法,其特征在于:所述步骤(2)的改进k-means算法是一种属于划分方法的聚类算法,采用欧氏距离作为2个样本相似程度的评价指标,随机选取数据集中的k个点作为初始聚类中心,根据数据集中的各个样本到k个初始聚类中心的距离大小进行聚类,计算所有归到各个聚类中的样本平均值,更新每个初始聚类中心,直到平方误差准则函数稳定在最小值。
5.根据权利要求1所述的一种基于改进k-means算法的海量智能用电数据分析方法,其特征在于:所述步骤(2)的选择初始聚类中心的方法如下:
1)根据如下式子计算对象集合M中的2个对象间的距离d(xi,xj);
d(xi,xj)=[(xi1-xj1)2+(xi2-xj2)2+…+(xin-xjn)2]
2)按照如下式子计算对象集合M中的所有对象间的平均距离MeanDis(M);
3)按照如下式子计算对象xi的密度Den(xi);
其中当x≥0时,u(x)=1,否则u(x)=0;
4)由上得到密度集D={Den(x1),Den(x2),…,Den(xn)},将密度集合D中密度最大的对象选为第1个初始聚类中心O1,选择密度第二大的对象作为第2个初选聚类中心O2,依此类推,将满足如下式子条件的对象yi作为第k个聚类中心,直到达到预定的聚类数为止;
max(min(d(yi,O1)),…,min(d(yi,On-1)))。
6.根据权利要求1所述的一种基于改进k-means算法的海量智能用电数据分析方法,其特征在于:所述步骤(2)是利用改进k-means算法求解最小的δ来确定聚类个数k,计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州天宽科技有限公司,未经杭州天宽科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510263237.3/1.html,转载请声明来源钻瓜专利网。