[发明专利]基于决策树的风控决策方法及系统在审
申请号: | 202310133837.2 | 申请日: | 2023-02-20 |
公开(公告)号: | CN115860926A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 甘宇;曾文忠;廖丹霞;彭新亮;黄轩;贺兰;柳习科;季敩民;张雷;刘斯凡;汪剑平;王君 | 申请(专利权)人: | 江西汉辰信息技术股份有限公司;深圳京发科技控股有限公司 |
主分类号: | G06Q40/03 | 分类号: | G06Q40/03;G06N5/01;G06F16/215 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 何世磊 |
地址: | 330000 江西省南昌市高新技术产业开发区高*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 决策树 决策 方法 系统 | ||
1.一种基于决策树的风控决策方法,其特征在于,包括:
获取决策对象的原始数据,并对所述原始数据进行预处理;
对预处理后的数据进行清洗,删除数据中的异常值;
对所述数据进行特征提取,获取所述数据的变量信息;
根据所述变量信息建立决策树模型,并对所述决策树模型进行调优;
将所述决策对象的风险评估结果通过可视化决策树展示。
2.如权利要求1所述的基于决策树的风控决策方法,其特征在于,所述对所述原始数据进行预处理步骤具体包括:冗余变量处理、缺失值处理、地方插变量处理以及异常值处理。
3.如权利要求2所述的基于决策树的风控决策方法,其特征在于,所述冗余变量处理的步骤包括:
删除所述原始数据中对所述决策树模型不产生影响的变量。
4.如权利要求2所述的基于决策树的风控决策方法,其特征在于,所述缺失值处理的步骤包括:
判断所述原始数据是否存在缺失值;
若是,则查询所述原始数据在前3年是否存在完整数据;
若所述原始数据在前3年存在完整数据,则根据前3年的数据求均值进行填充;
若所述原始数据在前3年不存在完整数据,则对缺失值进行补0填充。
5.如权利要求1所述的基于决策树的风控决策方法,其特征在于,所述对所述数据进行特征提取,获取所述数据的变量信息的步骤具体包括:缺失率筛选、IV值筛选以及相关性筛选。
6.如权利要求5所述的基于决策树的风控决策方法,其特征在于,所述缺失率筛选的步骤具体包括:
计算所有变量的缺失率,所述缺失率的计算方式为:
缺失率=变量值缺失的数量/变量值的总数量;
若任一所述变量的缺失率大于预设值,则删除对应变量。
7.如权利要求5所述的基于决策树的风控决策方法,其特征在于,所述IV值筛选的步骤具体包括:
计算所有变量的IV值;
筛选并保留IV值大于预设值的变量。
8.如权利要求5所述的基于决策树的风控决策方法,其特征在于,所述相关性筛选的步骤具体包括:
利用皮尔逊相关系数对所有变量进行相关性评估;
删除相关性大于预设值的变量。
9.如权利要求1所述的基于决策树的风控决策方法,其特征在于,所述根据所述变量信息建立决策树模型,并对所述决策树模型进行调优步骤具体包括:
调节参数至极致测试所述决策树模型的极限;
对所述决策树模型进行参数调优,其中,涉及到调优的参数包括叶子节点最小样本数、树分枝的最大深度和随机种子、叶子节点最小权重和、节点分枝最小纯度增长量和最大叶子节点数;
对所述决策树模型进行剪枝处理。
10.一种基于决策树的风控决策系统,其特征在于,所述系统包括:
数据获取模块:用于获取决策对象的原始数据;
预处理模块:用于对所述原始数据进行预处理;
清洗模块:用于对预处理后的数据进行清洗,删除数据中的异常值;
特征提取模块:用于对所述数据进行特征提取,获取所述数据的变量信息;
建模模块:用于根据所述变量信息建立决策树模型;
优化模块:用于对所述决策树模型进行调优;
可视化模块:用于将所述决策对象的风险评估结果通过可视化决策树展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西汉辰信息技术股份有限公司;深圳京发科技控股有限公司,未经江西汉辰信息技术股份有限公司;深圳京发科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310133837.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种火工品温度控制系统及温度控制方法
- 下一篇:缠绕设备