[发明专利]建立互联网金融风控模型的方法在审
申请号: | 201811545946.0 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109492712A | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 刘云翔;韩贝;徐琛;李晓丹 | 申请(专利权)人: | 上海应用技术大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200235 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风控 决策树 互联网 金融 决策树模型 多值属性 预警模型 统计学 边界点 传统的 预测 度量 算法 判定 改进 | ||
1.一种建立互联网金融风控模型的方法,其特征在于,包括:
结合统计学中相关系数理论,得出条件属性与决策属性之间的相关系数,根据相关系数的大小得出所述条件属性与决策属性之间的相关性大小;
分析数据来源,利用所述条件属性与决策属性之间的相关性大小,确定影响黑名单判别的重要影响因子,选出所述重要影响因子作为决策属性并放入数据集;
根据所述得出的所述条件属性与决策属性之间的相关性大小,并利用最大相关系数值的属性作为根结点,采用预设方法递归建立决策树的子结点,以形成决策树;
利用悲观剪枝算法对所述形成的决策树进行剪枝,形成简洁的决策树;
基于所述简洁的决策树建立互联网金融风控模型。
2.如权利要求1所述的建立互联网金融风控模型的方法,其特征在于,根据如下公式,得出条件属性与决策属性之间的相关系数:
令
公式中,Ak表示为决策树中不同的条件属性,B为决策树中的决策属性。Cov(Ak,B)为Ak与B的协方差,D(Ak)为Ak的方差,D(B)为B的方差,wk成为衡量决策属性和条件属性间相关程度的一种指标。
3.如权利要求1所述的建立互联网金融风控模型的方法,其特征在于,所述预设方法包括:
结合Fayyad边界点判定定理,计算所述数据集中每个决策属性的信息增益率,选择每个决策属性中分割点处最大的信息增益率作为该决策属性分割点。
4.如权利要求3所述的建立互联网金融风控模型的方法,其特征在于,所述信息增益率的定义如下:GainRate(A)=Gain(A)/SplitInfoA(D),其中,
C4.5决策树使用信息增益率克服数据的偏倚,使用分裂信息的值将信息增益规范化,所述分裂信息类似于Info(D)定义如下:
公式中,D为标记类元组的训练集。A为划分D中元组的属性。V为属性A元组D划分为不同的分区或子集{D1,D2,...,Dv},其中,项充当第j个分区的权重,SplitInfoA(D)是基于按A划分对D的元组分类所需要的期望信息,需要的期望信息越小,分区的纯度越高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海应用技术大学,未经上海应用技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811545946.0/1.html,转载请声明来源钻瓜专利网。