[发明专利]基于改进的CCA混合采样组合预测模型的数据分析方法在审

专利信息
申请号: 202111312044.4 申请日: 2021-11-08
公开(公告)号: CN113987952A 公开(公告)日: 2022-01-28
发明(设计)人: 蒋溢;伍书平;熊安萍 申请(专利权)人: 重庆邮电大学
主分类号: G06F30/27 分类号: G06F30/27;G06K9/62
代理公司: 重庆辉腾律师事务所 50215 代理人: 王海军
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 改进 cca 混合 采样 组合 预测 模型 数据 分析 方法
【权利要求书】:

1.一种基于改进的CCA混合采样组合预测模型的数据分析方法,其特征在于,包括:实时获取客户的数据信息,对获取的数据信息进行预处理;将预处理后的数据信息输入到改进的CCA混合采样组预测模型中,预测该客户是否存在流失风险,不存在流失风险,则保存该客户信息,存在流失风险,则根据客户信息制定挽留策略;

对改进的CCA混合采样组预测模型进行训练的过程包括:

S1:获取客户数据集,并对客户数据集进行预处理,得到子集;

S2:采用构造性覆盖算法CCA对子集中的数据进行处理,得到少数类覆盖样本集和多数类覆盖样本集;

S3:采用单样本覆盖策略对少数类覆盖样本集中样本进行筛选,得到第一关键覆盖样本,采用样本密度阈值策略对少数类覆盖样本集中的样本进行筛选,得到第二关键覆盖样本;

S4:采用SMOTE算法分别对第一关键覆盖样本和第二关键覆盖样本进行处理,得到第一少数类样本子集和第二少数类样本子集;

S5:计算多数类覆盖样本集中每个覆盖的采样数,根据每个覆盖的采样数采用样本多样性策略和样本密度峰值策略对多数类覆盖样本集中的样本进行筛选,得到第一多数类样本子集和第二多数类样本子集;

S6:将少数样本子集和多数类样本子集进行组合,得到四组平衡样本集;

S7:将四组平衡样本集中的数据分别输入到逻辑回归模型中,采用网格搜索法调参,当模型的auc取得最大值时,完成模型训练;

S8:将预测样本带入训练好的四个模型得到四组预测结果,将四组预测结果求并集,得到最终预测结果。

2.根据权利要求1所述的一种基于改进的CCA混合采样组合预测模型的数据分析方法,其特征在于,对客户数据集进行预处理的过程包括:采用均值填充和3δ原则方法对获取的客户数据集中的数据进行清洗;采用one-hot编码和Z-score方法分别对清洗后的离散型变量和连续型变量进行数据转换处理;根据转换后的数据构建用户数据特征;采用Lasso回归方法对构建的数据特征进行提取,得到流失数据特征,将流失数据特征作为子集。

3.根据权利要求2所述的一种基于改进的CCA混合采样组合预测模型的数据分析方法,其特征在于,采用one-hot编码和Z-score方法分别对清洗后的离散型变量和连续型变量进行数据转换处理的过程包括:

对于离散型变量,确定每一个变量的可能值;根据可能值采用one-hot编码方法对每个特征进行编码处理,得到二元特征,得到的所有二元特征两两互斥;

对于连续型变量,为解决特征间量纲不同问题,使用Z-score方法将不同量级的特征数据转化为统一量度的Z-score分值,处理后的特征数据均值为0,方差为1。

4.根据权利要求2所述的一种基于改进的CCA混合采样组合预测模型的数据分析方法,其特征在于,采用Lasso回归方法对构建的数据特征进行提取的过程包括:将数据(Xi,yi),i=1,2,…,N输入到回归系数方程中,得到回归系数值,不断调整回归系数方程中的参数t的值,得到多组回归系数值βj(t)(j=1,2,…,p);绘制回归系数值随参数t值的变化趋势,取趋势变得稳定时t值对应的βj(t)值,根据选取的回归系数值建立到Lasso回归方程,采用Lasso回归方程提取流失数据特征;其中Xi表示第i个样本点的特征向量,yi表示第i个样本点的流失类别,N表示样本点总数,t表示一个范围为[0,1]的随机参数,p表示特征维数。

5.根据权利要求4所述的一种基于改进的CCA混合采样组合预测模型的数据分析方法,其特征在于,建立的Lasso回归方程为:

ylasso=β01x12x2+…+βkxk

其中,βk表示筛选出的第k个回归系数,xk表示样本的第k维特征向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111312044.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top