[发明专利]基于变量影响度指标进行用户分群提额的方法、装置和电子设备在审
申请号: | 201910591961.7 | 申请日: | 2019-07-02 |
公开(公告)号: | CN110415103A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 乾春涛;沈赟;郑彦 | 申请(专利权)人: | 上海淇毓信息科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 乔东峰 |
地址: | 201500 上海市崇明区横沙乡富民*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分群 变量影响 分群规则 用户分群 用户群 电子设备 金融用户 影响度 自变量 计算机可读介质 风险识别 模型确定 用户数据 指标确定 新用户 因变量 预测 评估 | ||
1.一种基于变量影响度指标进行用户分群提额的方法,其特征在于,包括:
计算历史金融用户集中的用户数据的自变量对因变量的影响度指标;
根据所述影响度指标确定分群变量和分群规则;
对历史金融用户集中的用户按照所述分群规则进行分群,并为不同分群分别建立提额模型;
对于新用户,按照所述的分群规则进行分群,并使用与该用户对应的用户群的提额模型确定提额策略。
2.根据权利要求1所述的方法,其特征在于:
所述计算所述历史金融用户集中的用户数据的自变量对因变量的影响度指标包括:
使用Boruta算法计算所述自变量对因变量的影响度。
3.根据权利要求1-2任一项所述的方法,其特征在于:
使用Boruta算法计算所述自变量对因变量的影响度包括:
为整个历史金融用户集建立提额模型,并使用历史金融用户集训练该提额模型;
使用Boruta算法对自变量的影响度进行排序;
删选出具有较高影响度的自变量。
4.根据权利要求1-3任一项所述的方法,其特征在于:所述使用Boruta算法对自变量的影响度进行排序包括:
创建自变量的阴影特征,拼接到自变量的特征矩阵,构成新的特征矩阵;
使用所述新的特征矩阵训练所述提额模型,计算阴影特征和原自变量特征的重要分;
取阴影特征最大值,当自变量特征的重要分大于阴影特征重要时,记录一次命中;
利用所述自变量特征的累计命中次数作为作为影响度指标,对所述自变量的影响度进行排序。
5.根据权利要求1-4任一项所述的方法,其特征在于:所述为不同分群分别建立提额模型包括:
对于各用户群,分别由该用户群内的历史金融用户数据建立训练数据集、测试数据集及提额模型。
6.根据权利要求1-5任一项所述的方法,其特征在于:所述为不同分群分别建立提额模型还包括:
使用各用户群的训练数据集、测试数据集对相应的提额模型进行训练和测试。
7.根据权利要求1-6任一项所述的方法,其特征在于:还包括:
计算各模型的K-S值曲线,当所述所述K-S不满足预定目标时,对所述分群规则进行调整。
8.一种基于变量影响度指标进行用户分群提额的装置,其特征在于,包括:
指标计算模块,用于计算历史金融用户集中的用户数据的各变量的影响度指标;
规则确定模块,用于根据所述影响度指标确定分群变量和分群规则;
分群建模模块,用于对历史金融用户集中的用户按照所述分群规则进行分群,并为不同分群分别建立提额模型;
策略确定模块,对于新用户,按照所述的分群规则进行分群,并使用与该用户对应的用户群的提额模型确定提额策略。
9.一种电子设备,包括:
处理器;以及
存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,当所述一个或多个程序被处理器执行时,实现权利要求1-7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇毓信息科技有限公司,未经上海淇毓信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910591961.7/1.html,转载请声明来源钻瓜专利网。