[发明专利]一种用户投诉行为预测方法、系统、设备及介质在审
申请号: | 202111347727.3 | 申请日: | 2021-11-15 |
公开(公告)号: | CN114066049A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 邓志东;杨菁;李艳艳;王佳佳;朱龙珠;龚建;钱峰 | 申请(专利权)人: | 国家电网有限公司客户服务中心 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/00;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 300300 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 投诉 行为 预测 方法 系统 设备 介质 | ||
本发明公开了一种用户投诉行为预测方法、系统、设备及介质,所述方法包括以下步骤:获取网上国网用户在建模时间窗口的用户基本信息数据、用户行为数据、用户缴费信息数据,并对以上数据进行预处理;然后基于信息增益理论基础,筛选符合标准的变量,剔除贡献度较低的指标;构建GBDT树模型,将特征变量输入到模型中,将每个叶节点输出的特征变量构成一个新的组合特征;将GBDT模型训练得到的组合特征输入到Logistic模型,进行训练、优化模型,预测用户投诉的概率。本发明构建模型对网上国网用户进行预测,精度较高、适应性较强,能够有效实现对潜在投诉客户发出预警。
技术领域
本发明涉及电力行业的数据分析技术,特别是一种用户投诉行为预测方法、系统、设备及介质。
背景技术
网上国网数据库中存储着大量的用户信息,其中包括用户基本信息、用户行为日志信息、积分信息、缴费行为日志、用户支付行为信息等等。如果可以有效地激活、挖掘、组织这些处于“休眠期”的客户数据,将对网上国网APP提升核心竞争力、加快市场拓展、赢得长远利益的目标具有重大意义。而本文仅仅就网上国网APP用户投诉预警分析的角度,从网上国网大数据库中提取出相关数据进行研究。实际上,在对用户投诉行为做出预测分析以后,网上国网必然会采取相应的策略,预防潜在投诉客户发生投诉行为,提高用户满意度,并积极延长客户的生命周期。
用户行为预测模型中常用的方法是Logistic模型,GBDT由于其树状特性,数据敏感度较高,部分数据的调整会引发整体类别的变化,可处理数据量有限,需要一个相对比较钝化的模型。LR模型被发觉出来,LR模型的并行能力很强,能够处理较大的数据集,同时只能处理一维的特征,学习能力有限,需要大量的特征工程。
发明内容
发明目的:本发明的目的是提供一种精度较高、适应性较强的用户投诉行为预测方法、系统、设备及介质,从而有效延长客户的使用生命周期。
技术方案:本发明所述的一种用户投诉行为预测方法,包括以下步骤:
S1、确定建模时间窗口,获取网上国网用户在建模时间窗口的原始数据,并对以上数据进行预处理,得到处理后的用户数据;
S2、对步骤S1中的用户数据特征变量进行特征提取,主要先对数据进行卡方分箱,然后通过woe和iv值衡量变量预测能力,值越大特征变量预测能力越强,依据此来剔除贡献度差的指标,保留区分度高的指标;
S3、构建GBDT模型,设置参数,即每颗决策树最大叶子节点数目和决策树数目,将步骤S2中特征变量数据输入到模型中,每个叶节点经过算法迭代后得到的输出项就是新的特征变量,将原始特征与训练后得到的新特征构造成组合特征;
S4、构建Logistic回归模型,将步骤S3训练得到的组合特征输入模型中,通过模型训练后,得到预测结果。
步骤S1中所述的原始数据包括用户基本信息、用户行为日志、用户缴费数据。
步骤S1中所述的预处理包括以下步骤:
S1.1、对缺失值数据进行数据剔除、数据插补工作;
S1.2、对异常值进行部分直接剔除、部分平均值修补的工作;
S1.3、对噪声数据进行平滑处理工作。
步骤S3中所述的构建GBDT模型包括以下步骤:
S3.1、设置每颗决策树最大叶子节点数目α和决策树数目β,通过GBDT模型来构建特征组合;
S3.2、将训练样本输入到步骤S1训练得到的GBDT模型,每个叶子节点的输出项构建成组合特征。
一种用户投诉行为预测系统,包括以下模块:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司客户服务中心,未经国家电网有限公司客户服务中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111347727.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理