[发明专利]一种基于日差分用电量的贫困用户识别方法在审
申请号: | 202010600040.5 | 申请日: | 2020-06-28 |
公开(公告)号: | CN112200209A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 汪志奕;戴向文;谢岳;应张驰;陈佳怡;江硕;潘一洲;卢旭航 | 申请(专利权)人: | 国网浙江省电力有限公司金华供电公司;中国计量大学;浙江华云信息科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/06 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 王晓燕 |
地址: | 321017 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 日差分 用电量 贫困 用户 识别 方法 | ||
1.一种基于日差分用电量的贫困用户识别方法,其特征在于包括以下步骤:
1)获取用户的日用电量数据;
2)对日用电量数据进行预处理,对于残缺电量数据大于全年电量数据30%的用户进行剔除,对于残缺电量数据小于全年电量数据30%的用户使用相邻非缺失值的线性插值法进行数据补全,对于重复数据的用户利用时间排列去除;
3)将处理过的数据输入训练好的基于基尼系数决策树的分类模型中;
4)分类模型根据日用电量数据对贫困用户进行识别;
5)抽查识别结果,对分类模型的识别情况进行检验,获取用户的日用电量数据及实际的用户经济情况对分类模型识别的贫困用户进行核对,当分类模型的识别正确率小于设定阈值时,对分类模型重新进行训练;
在分类模型训练时:首先通过调查问卷方式对被调查用户群进行贫困用户的统计,然后将被调查用户分为训练样本群和测试样本群,同时对训练样本群的用户进行日用电量差分计算,得到日差分用电量数据,并利用统计方法从日差分用电量数据中分别提取贫困用户和非贫困用户用电特征数据;在此基础上对测试样本群进行验证并完善对贫困用户识别方法。
2.根据权利要求1所述的一种基于日差分用电量的贫困用户识别方法,其特征在于:分类模型训练包括以下步骤:
a)数据获取:包括通过实地调查问卷将社会信息进行统计,对非有效调查问卷进行剔除,得到贫困用户和非贫困用户名单;
b)按照贫困用户与非贫困用户比值为3:5进行用户用电数据的调取;
c)进行数据清洗与预处理;
d)按照2:1的比例划分为训练集用户群和测试集用户;并将日差分电量区间b初始设置为1;
e)按照日差分电量区间b对训练集进行日差分电量特征量YTA的计算;
f)利用YTA建立基尼系数决策树模型并利用测试集日差分电量特征量YTS进行预测;
g)计算其准确率R和精确率P,判断准确率R和精确率P是否大于设定的阈值,若是,结束训练;若否,则进入下一步;
h)按照区间b=b+0.5,并重新返回计算日差分电量特征Y构建决策树分析模型进行预测,直到准确率R和精确率P满足要求为止。
3.根据权利要求2所述的一种基于日差分用电量的贫困用户识别方法,其特征在于:在步骤d)中,对用户数据预处理后的用户总数为N,并按照2:1的比例将N划分为训练集用户群和测试集用户;其中测试集中共TA户,贫困用户为N1,非贫困用户为N2,测试集中共TS户,贫困用户为N3,非贫困用户为N4,则用户划分满足下列关系式:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司金华供电公司;中国计量大学;浙江华云信息科技有限公司,未经国网浙江省电力有限公司金华供电公司;中国计量大学;浙江华云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010600040.5/1.html,转载请声明来源钻瓜专利网。