[发明专利]一种基于逻辑回归算法的电费风险防控模型构建方法在审
申请号: | 201911177990.5 | 申请日: | 2019-11-26 |
公开(公告)号: | CN111126776A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 裘炜浩;钟雨星;杨世旺;施焕健;潘红雨;金王英;王迎卜;陈钰莹;翟胜闻;毛晋凯 | 申请(专利权)人: | 国网浙江省电力有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q30/06;G06Q50/06 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 王晓燕 |
地址: | 310007 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 逻辑 回归 算法 电费 风险 模型 构建 方法 | ||
1.一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,具体包括以下步骤:
第一步,数据采集
收集客户基本属性、交费行为、用电行为、业务变更信息数据;利用业务人员调研、基层访谈和其他外部系统方式渠道,收集客户第三方信用信息、行业前景评价、生产经营状况、突发事件外部信息数据;
第二步,数据检验
获取数据后,首先应对数据质量进行检验,包括:客户户号ID的唯一性检验,范围和取值检验,缺失值检验,异常值、离群值检验;
第三步,数据处理
数据处理主要包括对缺失值、离群值、异常值记录进行清洗处理以及相关衍生变量的生成过程,具体顺序为:缺失值、离群值、异常值处理到衍生变量生成;
第四步,模型构建
电费风险防控模型是对客户能否按时、足额缴纳电费的评估,主要从客户信用、用电趋势、行业景气指数和突发事件四个维度考虑;
客户信用维度主要从信用评价得分和信用变化趋势两方面设计指标;
用电趋势维度围绕用电量、容量、交费方式三方面来设计指标;
行业景气指数维度考虑行业景气度与行业景气度变化趋势指标;
突发事件维度考察当前发生的社会重大事件;
指标设计具体包括指标名称、计算规则、考察期和评价规则的设计;
以客户信用、用电趋势和行业景气度三个维度下的指标为基础,利用逻辑回归算法对客户未来是否逾期交费进行评估预测;
第五步,模型输出
基于逻辑回归算法构建的电费风险防控模型,实现对高压高风险用户的命中率和覆盖率、低压非居高风险用户的命中率和覆盖率及低压居民高风险用户统计评估。
2.如权利要求1所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第一步,数据信息具体如下:
基本属性数据:客户户号、户名、客户分类、用电类别、行业分类、容量、催费短信是否订阅;
交费行为数据:电费发行日、实收日期、应收电费、交费截止日、违约金起算日、实收电费、交费方式;
用电行为数据:违约用电历史记录、不法窃电历史记录、用电量历史记录、信用评价历史记录;
关联信息数据:第三方信用信息、行业前景评价、生产经营状况、突发事件。
3.如权利要求1所述的一种基于逻辑回归算法的电费风险防控模型构建方法,其特征在于,
所述第二步,
(1)客户户号ID的唯一性检验:建模训练基础数据集中,每个客户为一条观测数据,因此每个户号ID变量应该仅出现一次,否则需要核查原因,调整数据;
(2)范围和取值检验:建模训练数据集中使用的每个变量都应该来自一个定义清晰、具有已知的或预期取值范围的字段;连续变量的值应该在一定的预期范围内,而名义变量应取维表中的值;
(3)缺失值检验:识别建模训练数据集中每个字段的缺失值及其来源是完整性检验中的基本步骤;缺失值的产生可能是失误的结果,也可能是因为制定的字段没有被定义;
(4)异常值、离群值检验:异常值是指明显偏离数据集的观测值,如过大、过小、负值数据;异常值可能是由于记录错误引起的,也可能是真实数据;因此要检验异常值出现的原因,并相应的处理异常值;离群值被定义为某个变量平均值正负3个标准差以外的数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司,未经国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911177990.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理