[发明专利]一种用于客户流失预测的数据挖掘方法在审
申请号: | 202111163139.4 | 申请日: | 2021-09-30 |
公开(公告)号: | CN114154672A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 李培森 | 申请(专利权)人: | 中国农业银行股份有限公司河北省分行 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q40/02;G06F16/2458;G06K9/62 |
代理公司: | 石家庄德皓专利代理事务所(普通合伙) 13129 | 代理人: | 刘磊娜 |
地址: | 050000 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 客户 流失 预测 数据 挖掘 方法 | ||
1.一种用于客户流失预测的数据挖掘方法,其特征在于,包括数据获取步骤,特征变量选择步骤,样本选取步骤,数据预处理步骤,构建训练集和和测试集步骤和执行训练步骤,其中,
所述数据获取步骤包括,建立数据库,对接银行数据系统;
所述特征变量选择步骤包括,选取满足预测算法的特征变量;
所述样本选取步骤包括,根据原始算法,以所收集的数据,对客户流失量进行数据准备;
所述数据预处理步骤包括,整合基础数据,清理无关数据和空值;
所述构建训练集和测试集步骤包括,抽取样本,将所抽取的样本分为训练集和测试集;
所述执行训练步骤包括,按照模型参数的重要性程度进行训练,并以最优解滚动迭代。
2.根据权利要求1所述的一种用于客户流失预测的数据挖掘方法,其特征在于,所述数据获取步骤包括建立数据库,同时对接银行的数据系统对数据库进行信息传递。
3.根据权利要求2所述的一种用于客户流失预测的数据挖掘方法,其特征在于,所建立的数据库内容包括客户身份信息、客户资产信息、客户交易信息和产品信息。
4.根据权利要求3所述的一种用于客户流失预测的数据挖掘方法,其特征在于,所述客户身份信息包括客户ID、年龄和性别,所述产品信息包括活期存款指标、定期存款指标、贷款情况指标、卡业务使用及办理情况、投资理财业务指标和产品综合指标,所述客户资产信息包括总金融资产情况 FA/AUM 及其变动情况,所述客户交易信息包括渠道产品签约情况指标,AUM 交易渠道情况指标、流入、流出情况、大小额转账和第三方及同名账户指标。
5.根据权利要求1所述的一种用于客户流失预测的数据挖掘方法,其特征在于,所述特征变量选择步骤包括,根据算法需求,设定条件,选取满足条件的特征变量;
所述样本选取步骤包括,将选取的特征变量带入原始的算法,进行预测准备。
6.根据权利要求1所述的一种用于客户流失预测的数据挖掘方法,其特征在于,所述数据预处理步骤包括根据原始算法,以个人客户号为连接条件,对所选取的特征值进行排列和总结,清理特征值中的无关数据和空值。
7.根据权利要求1所述的一种用于客户流失预测的数据挖掘方法,其特征在于,所述构建训练集和测试集步骤包括根据预测需求,选取样本数据进行试验,并根据设定,划分为训练集和测试集。
8.根据权利要求1所述的一种用于客户流失预测的数据挖掘方法,其特征在于,根据原始算法,得到对模型影响最重要的参数,模型训练从对模型影响最重要的参数作为起点,按照对模型影响的重要性程度递减方向依次训练,每次训练将之前训练得到的最优解作输入固定,滚动迭代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司河北省分行,未经中国农业银行股份有限公司河北省分行许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111163139.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理