[发明专利]基于改进的CCA混合采样组合预测模型的数据分析方法在审
申请号: | 202111312044.4 | 申请日: | 2021-11-08 |
公开(公告)号: | CN113987952A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 蒋溢;伍书平;熊安萍 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 cca 混合 采样 组合 预测 模型 数据 分析 方法 | ||
本发明属于大数据分析与处理领域,具体涉及一种基于改进的CCA混合采样组合预测模型的数据分析方法,该方法包括:实时获取客户的数据信息,对获取的数据信息进行预处理;将预处理后的数据信息输入到改进的CCA混合采样组预测模型中,预测该客户是否存在流失风险,不存在流失风险,则保存该客户信息,存在流失风险,则根据客户信息制定挽留策略;本发明基于构造性覆盖算法CCA按照数据真实分布情况划分最佳少数类覆盖、多数类覆盖,能学习到真实的数据全局分布情况。
技术领域
本发明属于大数据分析与处理领域,具体涉及一种基于改进的CCA混合采样组合预测模型的数据分析方法。
背景技术
近年来,随着移动互联网的快速发展,电信企业拥有大量的客户和数以亿计的用户数据,每天更新数据量数百TB。这些数据包括用户基本信息、业务办理信息、流量话费消费、呼叫详细记录等,隐含大量提高客户稳定性的可能性信息,而稳定现有客户不仅会给企业带来更多的经济效益,也是市场逐渐饱和情况下的必然趋势。传统的统计方法和数据库管理方法已不再适用于海量数据的处理和分析,数据挖掘和机器学习可以帮助企业从海量繁杂的数据中分析影响客户流失的关键因素,为制定精准的客户挽留策略提供重要依据,稳定客户,解决客户流失问题。
客户流失是指客户终止对一个公司或者企业的合同而转向其他竞争对手公司,不仅会导致巨大的经济损失,甚至损害公司的公众形象。当下,市场逐渐饱和,电信业的发展更倾向于客户需求驱动和市场驱动,企业的管理、经营理念与体系逐步从“以产品为中心”转向“以客户为中心”,越来越多的公司认识到客户关系管理(CRM)的重要性,并迫切希望从海量客户信息中提取对企业有用的信息。由于市场饱和,获取新客户、扩大市场份额变得越来越困难且会消耗更高成本,所以留住现有客户,避免客户流失具有非常重要的现实意义。
客户流失预测即通过一定手段对客户数据分析找出存在流失风险的客户,它是实施客户挽留策略的前提条件。以流失预测结果为据可以更加高效地调配有效的营销资源,有针对性地制定客户挽留策略,提高资源利用率,减少客户流失,实现企业增益的目标。
数据不平衡是客户流失预测研究中常见的问题,近年来国内外学者也提出了很多方法来解决此问题,主要包括欠采样、过采样和混合采样三种策略。但上述方法都没有很好地保证非流失用户样本信息不丢失以及流失用户样本生成符合真实分布情况。
发明内容
为解决以上现有技术存在的问题,本发明提出了一种基于改进的CCA混合采样组合预测模型的数据分析方法,该方法包括:实时获取客户的数据信息,对获取的数据信息进行预处理;将预处理后的数据信息输入到改进的CCA混合采样组预测模型中,预测该客户是否存在流失风险,不存在流失风险,则保存该客户信息,存在流失风险,则根据客户信息制定挽留策略;
对改进的CCA混合采样组预测模型进行训练的过程包括:
S1:获取客户数据集,并对客户数据集进行预处理,得到子集;
S2:采用构造性覆盖算法CCA对子集中的数据进行处理,得到少数类覆盖样本集和多数类覆盖样本集;
S3:采用单样本覆盖策略对少数类覆盖样本集中样本进行筛选,得到第一关键覆盖样本,采用样本密度阈值策略对少数类覆盖样本集中的样本进行筛选,得到第二关键覆盖样本;
S4:采用SMOTE算法分别对第一关键覆盖样本和第二关键覆盖样本进行处理,得到第一少数类样本子集和第二少数类样本子集;
S5:计算多数类覆盖样本集中每个覆盖的采样数,根据每个覆盖的采样数采用样本多样性策略和样本密度峰值策略对多数类覆盖样本集中的样本进行筛选,得到第一多数类样本子集和第二多数类样本子集;
S6:将少数样本子集和多数类样本子集进行组合,得到四组平衡样本集;
S7:将四组平衡样本集中的数据分别带入训练逻辑回归模型,采用网格搜索法调参,当模型的auc取得最大值时,完成模型训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111312044.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:门架模板结构及模板系统
- 下一篇:提高抛光平坦度的化学机械抛光垫及其应用