[发明专利]一种基于机器学习算法的空巢用户用电异常检测方法在审
申请号: | 202011514652.9 | 申请日: | 2020-12-21 |
公开(公告)号: | CN113112374A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 李璟;毛秋云;谢岳;蔡慧;王颖;陈卫民;郭倩;卢子萌;陈建宇 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06Q50/06 | 分类号: | G06Q50/06;G06Q10/06;G06N3/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 算法 空巢 用户 用电 异常 检测 方法 | ||
1.一种基于机器学习算法的空巢用户用电异常检测方法,其特征在于,包括以下步骤:
(1)利用政府社会信息系统获得准确空巢用户标签列表,通过用电采集系统获取用户整年日负荷用电数据;
(2)采用均值滤波法对该用户日负荷数据进行非线性平滑处理;
(3)采用自适应余弦K-means算法对平滑处理后的负荷数据进行聚类,自动寻找聚类效果最优的聚类数k;
(4)计算聚类后每个簇的聚类中心曲线作为该用户典型日负荷用电曲线;
(5)计算步骤(3)中样本与每个簇的聚类中心的余弦相似度构建异常检测模型数据集;
(6)基于异常检测模型数据集构建无监督孤立森林异常用电检测模型;
(7)利用步骤(6)的异常用电检测模型对用户新用电数据进行异常检测。
2.根据权利要求1所述的基于机器学习算法的空巢用户用电异常检测方法,其特征在于:自适应余弦K-means算法包括以下步骤:
a)设提取的用户用电数据集D={d1,d2,…dn}∈Rs,即D为具有n维的s元数据集合,n为用户往日用电天数,s为用户每天96点的负荷电流数据;
b)进行自动搜索最优聚类数目k,首先确定聚类初始簇k值范围,以初始聚类数k=2进行余弦K-means聚类;
c)计算每类中的样本数Pi,若Pi不小于阈值α,则令聚类数k=k+1重新聚类,直至任意Pi小于阈值α时停止聚类,设此时聚类簇k值范围为2~N;
d)针对不同聚类数k=1,2…N,分别计算其平均轮廓系数SC和DBI指标;
平均轮廓系数SC:
式中ai表示样本i到同簇其它样本的平均距离;bi表示样本i到非同簇其它样本的平均距离的最小值;qi为该向量i的轮廓系数;N为样本个数;Q为平均轮廓系数。
聚类DBI指标:
式中k为聚类数,avg(dbi)为第i类簇中所有样本到聚类中心的平均距离,Dij为第i类和第j类簇聚类中心距离。
e)将DBI指标按照公式(3~4)进行正向化处理后构建评价指标矩阵X;
DBI=max(DBI)-DBI (3)
f)对评价指标矩阵X进行公式(5)标准化操作得到zij,并找出每列最大值Z+和最小值Z-。
g)按照公式(6)计算聚类数目为k=i(i=1,2,…N)时的综合评价得分fi:
式中,0≤fi≤1,fi越大代表聚类效果越好,选取fi最大时的i值作为最佳聚类数k。
3.根据权利要求2所述的基于机器学习算法的空巢用户用电异常检测方法,其特征在于:在步骤a)中余弦K-means聚类算法步骤如下:
1)首先定义聚类的余弦相似度指标,其计算公式如下:
式中A={xi|i=1,2,…,n}与B(yi|i=1,2,…,n)为两条用电曲线向量。
2)对聚类中心初始化,为了避免因初始化中心选择不当而导致K-means陷入局部最优的情况出现,随机选取了k个余弦相似度距离较远的样本d1,d2,…dk∈Rs作为初始聚类中心。
3)计算剩余样本与初始聚类中心之间余弦相似度,将其归类到相似度最近的簇中,按照公式(8)将每个簇的平均向量作为新的聚类中心Cj(j=1,2,…,k)。
式中,nj为簇j的样本数,di为属于类Cj的样本。
4)重复步骤3)不断迭代,直至准则函数SEE收敛,计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011514652.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像传感器及其形成方法
- 下一篇:井口作业装置及修井机