[发明专利]基于BIRCH算法和随机森林算法的电力客户分群方法在审
申请号: | 201911025643.0 | 申请日: | 2019-10-25 |
公开(公告)号: | CN110781959A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 戴诚;卓灵;詹然智;龚黎慧倩;王文娟;秦骁;彭云竹;赵中璇;邓雅文 | 申请(专利权)人: | 国家电网有限公司;国网重庆市电力公司信息通信分公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06;G06Q30/02;G06Q50/06 |
代理公司: | 11129 北京海虹嘉诚知识产权代理有限公司 | 代理人: | 吕小琴 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 算法 电力客户 聚类 客户数据 随机森林 分群 预处理 服务标准 价值水平 聚类分析 特征采集 特征分析 信息构建 有效地 子簇 支撑 制定 | ||
1.一种基于BIRCH算法和随机森林算法的电力客户分群方法,其特征在于,包括以下步骤:
S1:选取电力客户特征作为聚类分析对象,并根据所选特征采集电力客户信息构建客户数据集,并对所述客户数据集进行预处理;
S2:采用BIRCH算法对经预处理后的所述客户数据集进行初步聚类得到聚类子族;
S3:采用随机森林算法对所述聚类子簇进行二次聚类实现电力客户分群。
2.根据权利要求1所述的基于BIRCH算法和随机森林算法的电力客户分群方法,其特征在于,选取消费水平特征、掉电敏感程度特征、用户欠费风险特征和用户设备风险特征作为聚类分析对象。
3.根据权利要求2所述的基于BIRCH算法和随机森林算法的电力客户分群方法,其特征在于,对所述客户数据集进行预处理所采用的具体步骤为:
S11:判断所述客户数据集中数据是否有缺失,若有缺失,则采用中值插补法对特征维度丢失数小于或等于2的数据进行填补,删除特征维度丢失数大于2的数据;否则,直接执行步骤S12;
S12:采用箱型图对所述客户数据集中的数据进行统计并识别所述客户数据集中的数据是否异常,若存在异常数据,则对异常数据进行重新采集或采用中值插补法替换异常数据;否侧,直接执行步骤S13;
S13:统一客户数据集中的各数据的数据形式,将统一形式后的数据进行标准化处理;
S14:根据步骤S13得到的最终数据构建多特征序列矩阵C,所述C具体为:
其中,n为客户数据集中样本的数量,cjk为第j个样本的第k个特征的相关参数,每个样本中所具有的特征数目为4。
4.根据权利要求3所述的基于BIRCH算法和随机森林算法的电力客户分群方法,其特征在于,采用箱型图对所述客户数据集进行统计并识别所述客户数据集中的数据是否异常,所采用的具体方法为:
采用箱型图对所述客户数据集进行统计,定义不同属性的所有数据的上四分位U和下四分位L,同时设定上四分位U与下四分位L的差值为IQR=U-L,则可得到属性的所有数据正常浮动的上限Uk和下限Lk,
Uk=U+1.5IQR
Lk=L-1.5IQR
则超出上限Uk和下限Lk之间的数据则判断为异常数据。
5.根据权利要求4所述的基于BIRCH算法和随机森林算法的电力客户分群方法,其特征在于,所述步骤S13具体包括:
S131:通过不同的数学统计方式寻找客户数据集中的各数据的衍生字段,通过衍生字段进行数据形式的统一;
S132:将客户数据集中的每一个特征数据与该特征数据所对应的均值的差除以该特征数据的标准差得到标准化后的数据,并根据各特征数据的影响因子μi的大小为其匹配设置不同的比重使数据标准化,所述每个特征数据对应的比重Pi为:
6.根据权利要求5所述的基于BIRCH算法和随机森林算法的电力客户分群方法,其特征在于,所述步骤S2具体包括以下步骤:
S21:设定BIRCH算法内部节点的最大CF数B,叶子节点的最大CF数L,空间阈值T;
S22:将预处理后的客户数据集以指针的形式读入到内存当中;
S23:通过BIRCH算法对客户数据集进行扫描得到一棵原始的CF树,计算客户数据集混合特征;
S24:选取任意两个电力公司客户的混合特征作为特征族计算混合特征距离,并根据计算出的混合特征距离,将距离最近的两个混合特征进行合并;
S25:重复步骤S24,直到所有电力公司客户的混合特征都被聚类成为一个聚类子族。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司;国网重庆市电力公司信息通信分公司,未经国家电网有限公司;国网重庆市电力公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911025643.0/1.html,转载请声明来源钻瓜专利网。