[发明专利]基于多种聚类算法和多元线性回归的电力客户聚类方法在审
申请号: | 202111422921.3 | 申请日: | 2021-11-26 |
公开(公告)号: | CN114155023A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 伍福平;李科;杨德祥;蔺海明;黄耀 | 申请(专利权)人: | 国网重庆市电力公司市南供电分公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/06;G06F16/903;G06F16/906 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
地址: | 401120 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多种 算法 多元 线性 回归 电力 客户 方法 | ||
1.一种基于多种聚类算法和多元线性回归的电力客户聚类方法,其特征在于,所述方法包括以下步骤:
(1)通过多种聚类算法对电力客户数据集进行预分类;
(2)根据预分类结果对电力客户数据集中的电力客户数据进行关键实例选取;
(3)以关键实例为基础建立多元线性回归模型,并构建用于求解每种聚类算法权重系数的目标求解函数,求解目标函数获得每种聚类算法的权重系数;
(4)根据每种聚类算法的权重系数进行决策分类的综合计算,实现对电力客户数据的分类。
2.根据权利要求1所述的基于多种聚类算法和多元线性回归的电力客户聚类方法,其特征在于,步骤(1)中所述多种聚类算法包括K-Means、DPCA、模糊C均值聚类算法和层次聚类算法。
3.根据权利要求1所述的基于多种聚类算法和多元线性回归的电力客户聚类方法,其特征在于,步骤(1)中通过多种聚类算法对电力客户数据集进行预分类,具体包括以下步骤:
S11、每种聚类算法根据自身的聚类原则,对电力客户数据集进行无类别划分的聚类操作,将电力客户数据集划分成预先设定好的簇数;
S12、以其中任意一种聚类算法为基础,将该聚类算法聚成的簇数同其余几种聚类算法聚成的簇数进行一一查询比较,根据交集个数最多被分为一类的原则,依次对每种聚类算法的簇数进行分类;
S13、将每类结果的前几个数据点与专家进行交互获得其真实类别,将这几个数据点中类别相同个数最多的类别标记上伪标签。
4.根据权利要求3所述的基于多种聚类算法和多元线性回归的电力客户聚类方法,其特征在于,步骤S13中,已被标记了伪标签的类别不再计算其类别个数。
5.根据权利要求1所述的基于多种聚类算法和多元线性回归的电力客户聚类方法,其特征在于,步骤(2)中对电力客户数据集中的电力客户数据进行关键实例选取,具体包括:
S21、定义电力客户数据的局部密度:
式中:x表示所选取的电力客户数据点的向量形式,xi表示局部密度更高的数据点的向量形式,dc表示截止距离;dist表示两个数据之间的欧氏距离;χ()为一个判断函数,若括号内的值小于0,则χ=1;若括号内的值大于等于0,则χ=0;
S22、定义电力客户数据点与局部密度更高的数据点的最小距离:
S23、根据局部密度及最小距离计算电力客户数据的优先级:
p=δ×ρ
S24、获取优先级最大的电力客户数据,将优先级最大的电力客户数据循环计算k次,获取k个数据即为电力客户数据中的关键实例,所述循环计算公式为
式中Xtrain为训练集,xused为当前已被得到的离xmax最近的电力客户数据点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网重庆市电力公司市南供电分公司,未经国网重庆市电力公司市南供电分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111422921.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种镂空碟形弹簧
- 下一篇:一种团队业务收费确认方法及装置