[发明专利]一种基于Kd树与Canopy优化Bisecting K-means的负荷聚类方法在审
申请号: | 202010543636.6 | 申请日: | 2020-06-15 |
公开(公告)号: | CN111783850A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 黄明磊;周子豪;凌华明;廖志戈;裴星宇;黄晓英;李建标;邓丽芬;郭斯晓;张璇;沈欣炜;孙宏斌 | 申请(专利权)人: | 广东电网有限责任公司;广东电网有限责任公司珠海供电局 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/06 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 戴涛 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 kd canopy 优化 bisecting means 负荷 方法 | ||
1.一种基于Kd树与Canopy优化Bisecting K-means的负荷聚类方法,其特征在于:包括以下步骤:
S1.采集指定时间段内各个用户的用电负荷数据,并对用电负荷数据进行预处理得到负荷数据集X;
S2.将负荷数据集X输入Canopy算法中,得到聚类个数K,同时,建立负荷数据集X的Kd树;
S3.将步骤S2中得到聚类个数K作为参数输入Bisecting K-means算法,再将负荷数据集X输入Bisecting K-means算法进行聚类分析,Kd树对Bisecting K-means算法进行加速计算;
S4.得到聚类结果。
2.根据权利要求1所述的一种基于Kd树与Canopy优化Bisecting K-means的负荷聚类方法,其特征在于:所述步骤S1中,对用电负荷数据进行缺损值填充,异常值替换,降维和归一化的预处理之后得到负荷数据集X。
3.根据权利要求2所述的一种基于Kd树与Canopy优化Bisecting K-means的负荷聚类方法,其特征在于:所述步骤S2中,Canopy算法包括以下步骤:
S211.复制负荷数据集X得到数据集Xcopy,根据先验知识或交叉验证调整初始距离阈值T1、T2,且T1≥T2;
S212.从数据集Xcopy中随机选择一个样本x1作为第一个Canopy的聚簇质心c1,质心集记为C,c1∈C,并将c1从数据集Xcopy中删除。
S213.从数据集Xcopy中随机选择一个样本xi,计算其到质心集中所有质心的距离dij,dij代表第i个样本到第j个质心的距离,考察其中最小的距离如果则给xi一个弱标记,表示xi属于cj,并将xi加入其中;如果则给xi一个强标记,表示xi属于该cj,且和质心非常接近,因此将xi从Xcopy中删除;如果则xi形成一个新的聚簇质心cnew,加入质心集C,并将xi从Xcopy中删除;
S214.重复步骤S213直到数据集Xcopy为空,得到聚簇质心数量即聚类个数K。
4.根据权利要求3所述的一种基于Kd树与Canopy优化Bisecting K-means的负荷聚类方法,其特征在于:所述步骤S2中,Kd树的建立使用递归的KdConstruct(X,h=0,H=d)函数,包括以下步骤:
S221.输入负荷数据集X,Kd树的当前深度h和截止深度H,其中H=d,d为数据集的维度;
S222.计算负荷数据集X中每一维数据的方差值,将维度序号按方差大小来排序,形成Split List,取Split List中第h维的中点值作为分割点MidPoint,将负荷数据中的数据X分为两个集合和根节点Root包含整个样本集X。
S223.建立根节点Root的左右子节点,Lchild为左子节点,包含样本集Xleft,Rchild为右子节点,包含样本集Xright,Lchild=KdConstruct(Xleft,h+1,H),Rchild=KdConstruct(Xright,h+1,H),递归地调用直到子节点为叶子节点,或h=H;
S224.返回根节点Root。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司珠海供电局,未经广东电网有限责任公司;广东电网有限责任公司珠海供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010543636.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:大数据健康预测系统
- 下一篇:一种中央空调控制系统