[发明专利]基于BIRCH算法和随机森林算法的电力客户分群方法在审
申请号: | 201911025643.0 | 申请日: | 2019-10-25 |
公开(公告)号: | CN110781959A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 戴诚;卓灵;詹然智;龚黎慧倩;王文娟;秦骁;彭云竹;赵中璇;邓雅文 | 申请(专利权)人: | 国家电网有限公司;国网重庆市电力公司信息通信分公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06;G06Q30/02;G06Q50/06 |
代理公司: | 11129 北京海虹嘉诚知识产权代理有限公司 | 代理人: | 吕小琴 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 算法 电力客户 聚类 客户数据 随机森林 分群 预处理 服务标准 价值水平 聚类分析 特征采集 特征分析 信息构建 有效地 子簇 支撑 制定 | ||
本发明公开了一种基于BIRCH算法和随机森林算法的电力客户分群方法,该方法包括以下步骤:S1:选取电力客户特征作为聚类分析对象,并根据所选特征采集电力客户信息构建客户数据集,并对所述客户数据集进行预处理;S2:采用BIRCH算法对经预处理后的所述客户数据集进行初步聚类得到聚类子族;S3:采用随机森林算法对所述聚类子簇进行二次聚类实现电力客户分群。本发明通过基于随机森林算法和基于BIRCH算法的电力客户的分群,能够有效地对电力公司的客户数据进行聚类,并通过对客户群内的特征分析得出每一类客户群的总体价值水平,为制定对应的服务标准提供支撑。
技术领域
本发明涉及一种基于BIRCH算法和随机森林算法的电力客户分群方法。
背景技术
随着电力改革深化、售电侧市场的全面放开,国家电网公司各级供电公司均面临着市场竞争压力,为提升电网企业盈利能力和竞争力,增加优质客户的忠诚度、满意度和客户黏性,企业在做好全社会普遍服务的基础上,为优质客户提供优质服务将是各售电主体竞争优质客户的主要手段和策略,必须制定有针对性的竞争服务策略,将有限的服务资源投入到优质客户的身上,与其建立稳定的供用电关系,是电网企业保持长期可持续发展的必然选择。
目前在电网企业中,客户分群技术主要有基于随机森林算法和基于BIRCH算法。单独使用随机森林算法对客户进行聚类时如果对大容量客户数据集进行处理,聚类速度会十分缓慢;而单独使用BIRCH算法时,聚类特征树对每个节点的聚类特征个数有限制,导致聚类的结果和真实分布不同并且对高维特征的数据聚类效果不好。
发明内容
本发明的目的是提供一种基于BIRCH算法和随机森林算法的电力客户分群方法,以解决目前的聚类算法无法高效准确地对电力客户分群的问题。
为解决上述技术问题,本发明提供一种基于BIRCH算法和随机森林算法的电力客户分群方法,包括以下步骤:
S1:选取电力客户特征作为聚类分析对象,并根据所选特征采集电力客户信息构建客户数据集,并对所述客户数据集进行预处理;
S2:采用BIRCH算法对经预处理后的所述客户数据集进行初步聚类得到聚类子族;
S3:采用随机森林算法对所述聚类子簇进行二次聚类实现电力客户分群。
进一步地,选取消费水平特征、掉电敏感程度特征、用户欠费风险特征和用户设备风险特征作为聚类分析对象。
进一步地,对所述客户数据集进行预处理所采用的具体步骤为:
S11:判断所述客户数据集中数据是否有缺失,若有缺失,则采用中值插补法对特征维度丢失数小于或等于2的数据进行填补,删除特征维度丢失数大于2的数据;否则,直接执行步骤S12;
S12:采用箱型图对所述客户数据集中的数据进行统计并识别所述客户数据集中的数据是否异常,若存在异常数据,则对异常数据进行重新采集或采用中值插补法替换异常数据;否侧,直接执行步骤S13;
S13:统一客户数据集中的各数据的数据形式,将统一形式后的数据进行标准化处理;
S14:根据步骤S13得到的最终数据构建多特征序列矩阵C,所述C具体为:
其中,n为客户数据集中样本的数量,cjk为第j个样本的第k个特征的相关参数,每个样本中所具有的特征数目为4。
进一步地,采用箱型图对所述客户数据集进行统计并识别所述客户数据集中的数据是否异常,所采用的具体方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司;国网重庆市电力公司信息通信分公司,未经国家电网有限公司;国网重庆市电力公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911025643.0/2.html,转载请声明来源钻瓜专利网。