[发明专利]一种基于大数据的高价低接用户识别方法在审
申请号: | 201910764680.7 | 申请日: | 2019-08-19 |
公开(公告)号: | CN110675020A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 段志田;陈莹;邹禹平;贾嘉;董兵;高伟;臧依璨;高嘉伟 | 申请(专利权)人: | 国网天津市电力公司;国家电网有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q30/02;G06Q50/06;G06K9/62;G06N3/08 |
代理公司: | 12214 天津创智天诚知识产权代理事务所(普通合伙) | 代理人: | 陈昌娟 |
地址: | 300010*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问题对象 大数据 电价 感知器神经网络 交叉验证法 标准分类 表象特征 电费计算 工作开展 关联模式 规章要求 回归模型 基础构建 机器学习 模型特征 神经网络 特征分析 行业特征 业务特征 用户识别 优化监控 不一致 准确率 三层 匹配 梳理 档案 挖掘 检查 发现 监督 学习 政策 | ||
1.一种基于大数据的高价低接用户识别方法,其特征在于,按照下列步骤进行:
步骤一、模型特征变量提取
基于业务规章要求、重点工作开展情况、内外部检查发现的问题,梳理业务特征项,形成模型的基础构建;
步骤二、高价低接特征分析
高价低接特征包括:1)用户行业特征与用电特征不匹配;2)电价执行与政策不符;3)档案与电费计算的执行情况不一致;
步骤三、模型算法设计
(1)对用电采集数据进行抽取与存储,通过采集数据治理实现数据预处理;
(2)采用深度学习框架TensorFlow搭建大数据建模,利用GPU设备加速训练;
(3)采用K折交叉验证对模型效果进行验证;
(4)模型部署后通过离线分析和线上分析同时进行模型评估;
(5)用电历史核查记录中各种高价低接等违约用电的标签y=1,其它用户作为负样本y=0,针对公变低压用户和专变用户分别建立高价低接分析模型,对比并选择梯度上升决策树、LSTM神经网络时序模型、SVM模型,通过模型训练,建立X与y的关联;LSTM模型结构如下所述:每一个时刻,神经网络模型的输入包含当前时刻的多维特征X,通过各隐藏层的变换,得到当前时刻t的n个状态节点St=<S1,S2,S3,…,Sn>,在此DNN网络基础上,结合时序长短期记忆模型,时刻t的输出为当前时刻状态St和前一时刻状态St-1的函数Ot=f(St+W*St-1),LSTM能够同时建模客户长期和短期数据中依赖关系,并随着时间发展迭代训练、预测,模型最终输出违约用电的概率Pi=1/(1+e-Ot);
(6)违约用电识别模型根据人工核实结果,反馈到模型的训练过程中,形成数据优化闭环,持续优化模型效果;
步骤四、机器学习
长期积累发现的问题案例数据,定期将核查确定的结果作为经验信息,输入规则优化模型,通过大数据监督学习模型,实现机器学习,找出高价低接判断对象的表象特征与高价低接判断问题的潜在关联模式,不断优化监控指标及规则,提升问题对象挖掘的全面性,提高疑似问题对象的准确率;
步骤五、高价低接用户识别
基于数据模型实现对高价低接用户的识别,根据分析出的结果结合用电检查等现场核查工作完成现场甄别,助力相关的异常问题处理。
2.如权利要求1所述的一种基于大数据的高价低接用户识别方法,其特征在于:在步骤二中,所述用户行业特征与用电特征不匹配的特征数据包括:电价为农业排灌,每月存在电量、居民电价用户月用电量过大、学校用电特征不符、居民照明用户电价行业分类为非居民、临时用电户执行大工业电价、临时用电户超期、临时用电户销户还有预收、执行大工业、农业、一般工商业电价的行业分类为居民生活、电采暖电价用户冬季用电量偏小、零售行业谷段电量过大、行业为制造业,负载率低于一定值、充电电价用电,但是用电量较高、合同容量小于110kv户名中含酒店、餐饮、宾馆、饭店、冷库、商城、超市的不应执行分时电价、户名含“居委会”没有执行居委会电价、户名含“学校”“幼儿园”没有执行学校电价、户名含“排灌”没有执行排灌电价的。
3.如权利要求1所述的一种基于大数据的高价低接用户识别方法,其特征在于:所述电价执行与政策不符的特征数据包括:
①变压器容量在100KVA以下用户,功率因数标准应该为“不考核”;
②变压器容量在100KVA以上的农业户和趸售用户,功率因数标准应该为0.8;
③变压器容量在100KVA以上、160KVA以下的工业及非工业用户,功率因数标准应该为0.85;
④变压器容量在160KVA以上的工业用户,功率因数标准应该为0.9;
⑥功率因数标准执0.9,变压器容量低于160KVA;
⑦合同容量小315KVA,不能执行大工业电价;
⑦执行农业电价,不应执行分时;
⑧需量用户,核定需量小于容量之和40%;
⑨减容期满后的用户以及新装、增容用户,两年内申办减容或暂停的基本电费收取50%。
4.如权利要求1所述的一种基于大数据的高价低接用户识别方法,其特征在于,所述档案与电费计算的执行情况不一致的数据特征为:计量方式为高供低计的用户,未计收变损。
5.如权利要求1所述的一种基于大数据的高价低接用户识别方法,其特征在于,所述步骤四中的机器学习的实施步骤如下:
1)对高价低接监控触发时,结合高价低接判断指标与规则体系,全面记录当期各类高价低接判断对象的特征信息与疑似问题对象的高价低接判断结果信息;通过长期积累,形成海量的高价低接判断对象特征信息与高价低接判断结果信息数据,以此数据为训练样本数据,输入规则优化模型开展机器学习训练。
2)在高价低接判断周期触发前,基于历史积累的高价低接判断经验数据对当期高价低接判断主题开展机器学习训练,根据历史高价低接判断案例数据中的高价低接判断对象特征信息与高价低接判断结果信息数据,采用有监督学习相关大数据技术,寻找出能表征对象是否存在问题的表象特征,明确高价低接判断对象表象特征与高价低接判断问题的关联模式。基于该模型对历史经验案例的客观分析,为高价低接判断指标与规则体系优化提供指导建议。
3)综合分析客户用电档案、行业分类、用电设备、负荷特性、售电均价等因素,汲取专家高价低接判断经验,利用大数据技术,建立销售电价执行高价低接判断数据模型,对分类电价、分时电价、基金与附加、基本电费、力调电费自行情况进行分析,为规范销售电价执行管理提供依据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网天津市电力公司;国家电网有限公司,未经国网天津市电力公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910764680.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理