[发明专利]一种多特征组合策略的推荐方法有效
申请号: | 202111581471.2 | 申请日: | 2021-12-22 |
公开(公告)号: | CN113961774B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 王萍;贾坤 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06F16/9038;G06F3/0484;G06F3/04847;G06Q40/02;G06Q20/40 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 蒋秀清 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 组合 策略 推荐 方法 | ||
1.一种多特征组合策略的推荐方法,其特征在于,包括以下步骤:
步骤1:任务定义模块根据多特征组合策略的挖掘需要,通过界面化自定义推荐任务;
步骤2:样本选择模块根据自定义的推荐任务,选择关联的数据集,指定相互关联的数据集生成样本数据大宽表;
步骤3:特征加工模块对样本数据大宽表中的原始特征变量进行可视化配置,实现基于表达式运算的自定义二次加工能力,衍生丰富的特征;
步骤4:目标自定义模块对可视化配置后的数据集进行目标变量的定义;
步骤5:特征选择模块通过可视化界面选择每个目标变量的特征推荐方法;
步骤6:多特征组合策略推荐模块通过可视化界面定义每个目标变量的策略推荐方法和阈值,并基于步骤5选择的每个目标变量的特征推荐方法,生成推荐的多特征组合策略集;
步骤7:报告生成模块基于多特征组合策略推荐模块生成的多特征组合策略集生成显著多特征组合策略推荐报告;
所述步骤6中所述的多特征组合策略推荐模块包括四种推荐方法,所述四种推荐方法分别为:基于WOE计算的推荐方法、等距划分分组方法、分位数划分分组方法和决策树划分分支方法;所述阈值的评价指标为Lift和坏占比指标;
所述步骤6包括以下步骤:
步骤6.1:所述基于WOE计算的推荐方法是对每条多特征组合策略进行分组,通过记录每个分组的临界点作为每个特征变量的阈值,遍历所有特征、阈值和运算符的组合,并对每条多特征组合策略计算坏占比和Lift指标,生成推荐的多特征组合策略集;
步骤6.2:所述等距划分分组方法是对每条多特征组合策略进行等距划分分组,记录每个分组的临界点作为规则阈值,基于每条多特征组合策略的坏占比和Lift指标遍历各个特征、阈值以及预算符的组合,生成推荐的多特征组合策略集;
步骤6.3:所述分位数划分分组方法通过分位数划分分组,记录每个分组的临界点作为规则阈值,基于坏占比和Lift指标遍历各个特征、阈值以及运算符的组合,生成推荐的多特征组合策略集;
步骤6.4:所述决策树划分分支方法通过决策树划分分支,每一条分支为一条多特征组合策略,基于坏占比和Lift指标遍历每个分支,生成推荐的多特征组合策略集;
所述步骤6.1包括以下步骤:
步骤6.1.1:规则阈值点集生成子模块通过对特征变量进行WOE单调分箱,寻找所有箱中的临界点,生成所有特征变量的规则阈值点集;
步骤6.1.2:多特征组合策略评价指标遍历子模块通过交叉遍历的方式,遍历所有特征变量的规则阈值点集,生成多特征组合策略集,并计算每条多特征组合策略的坏占比,生成多特征组合策略的坏占比指标集;
步骤6.1.3:多特征组合策略集推荐子模块根据阈值的评价指标Lift,并基于多特征组合策略的坏占比指标集生成推荐的多特征组合策略集;
所述步骤6.2包括以下步骤:
步骤6.2.1:规则阈值点集生成子模块对特征变量进行等频分组;基于等频分组后生成所有规则阈值点集的方法如下:
经过等频分组后,最大的组数划分为n组;定义特征变量为Xi;则有n+1个临界点;
设特征变量Xi的最大值和最小值分别为maxi和mini,则对应的分组之间的临界点集分别为则其中i=1,2,......,m;j=1,2,......,n+1;
基于临界点集生成所有规则阈值点集:
其中i=1,2,......,m;
步骤6.2.2:多特征组合策略评价指标遍历子模块通过交叉遍历的方式,遍历所有特征变量的规则阈值点集,生成多特征组合策略集,并计算每条多特征组合策略集的坏占比,生成多特征组合策略的坏占比指标集;
步骤6.2.3:多特征组合策略集推荐子模块根据阈值的评价指标Lift,并基于多特征组合策略的坏占比指标集,自动生成推荐的多特征组合策略集;
所述步骤6.3包括以下步骤:
步骤6.3.1:规则阈值点集生成子模块对特征变量进行分位数分组,计算每个特征变量中的每个分组之间的临界点集,基于临界点集生成所有特征变量的规则阈值点集;
步骤6.3.2:多特征组合策略评价指标遍历子模块通过交叉遍历的方式,遍历所有特征变量的规则阈值点集,生成多特征组合策略集;并计算每条多特征组合策略集的坏占比,生成多特征组合策略的坏占比指标集;
步骤6.3.3:多特征组合策略集推荐子模块根据阈值的评价指标Lift,并基于多特征组合策略的坏占比指标集,自动生成推荐的多特征组合策略集;
所述步骤6.4包括以下步骤:
步骤6.4.1:规则阈值点集生成子模块根据目标变量和特征变量,构建基于基尼系数的CART分类回归二叉树;遍历二叉树中的每个特征的每一种分裂方式,找到最好的分裂特征的方式,来对特征变量进行分组,生成每个分组之间的临界点集;并基于临界点集生成所有特征变量的规则阈值点集;
步骤6.4.2:多特征组合策略评价指标遍历子模块通过交叉遍历的方式,遍历所有特征变量的规则阈值点集,生成多特征组合策略集;并计算每条多特征组合策略集的坏占比,生成多特征组合策略的坏占比指标集;
步骤6.4.3:多特征组合策略推荐子模块根据阈值的评价指标Lift,并基于多特征组合策略的坏占比指标集自动生成推荐的多特征组合策略集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111581471.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全天候违法行为自动化巡检方法及系统
- 下一篇:光学成像镜头及成像设备