[发明专利]个人金融信用风险评价方法、系统和存储介质有效
申请号: | 201911284749.2 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111062806B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 杨颖;高星雨;杨淮;徐冬玲;杨剑波 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 北京久诚知识产权代理事务所(特殊普通合伙) 11542 | 代理人: | 余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 个人 金融 信用风险 评价 方法 系统 存储 介质 | ||
1.一种个人金融信用风险评价方法,其特征在于,所述评价方法由计算机执行,包括以下步骤:
获取客户信用数据,形成历史数据;
对所述历史数据进行聚类处理,得到若干个信用簇群;所述信用簇群包括:正信用簇群和负信用簇群;
将所述正信用簇群和所述负信用簇群随机配对,得到用于集成学习的若干个信用样本子集,包含均衡样本子集和非均衡样本子集;
对所述信用样本子集进行过滤,获取其中的非均衡样本子集;
获取所述非均衡样本子集的采样倍率;基于所述采样倍率,利用smote方法对所述非均衡样本子集进行采样处理,得到均衡的采样样本子集;
综合所述采样样本子集和所述均衡样本子集,构建用于集成学习的基分类器的输入样本;
采用决策树作为集成学习中的弱分类器,基于证据推理规则方法融合若干个弱分类器的分类结果,得到信用风险评价结果;
基于K-means方法对所述历史数据进行聚类处理,具体包括:
初始化所述历史数据,得到正类样本数据和负类样本数据;
设置聚类中心数的取值范围;
确定所述正类样本数据和所述负类样本数据的聚类中心数的最优值;
输出正信用簇群和负信用簇群。
2.如权利要求1所述的评价方法,其特征在于,所述信用样本子集的获取方法包括:
组合配对:从生成的个正信用簇群和个负信用簇群中随机挑选单个子集进行配对组合,共形成个包含正负类样本的新数据集。
3.如权利要求1所述的评价方法,其特征在于,对所述信用样本子集进行过滤,具体包括:
确定每个信用样本子集中少数类样本与多数类样本的比例,若少数类样本占比少于50%,则为非均衡样本子集,否则为均衡样本集;
其中:少数类样本指的是信用坏的客户数据,多数类样本指的是信用好的客户数据。
4.如权利要求3所述的评价方法,其特征在于,所述采样倍率的计算方法包括:
根据样本不平衡比例IL以确定采样倍率n;
n=round (IL)
其中:
round表示对IL四舍五入;
其中:
majority表示多数类样本,minority表示少数类样本。
5.如权利要求4所述的评价方法,其特征在于,对所述非均衡样本子集进行采样处理,得到均衡样本子集,具体包括:
计算所述非均衡样本子集内少数类样本之间的欧式距离矩阵;
在少数类样本xi的k个近邻样本中随机选择一个样本作为辅助样本,在样本xi与每个辅助样本间进行线性插值;具体为:
xnew,attr=xi,attr+(xij,attr-xi,attr)×γ
其中:
xi∈Rd,xi,attr表示第i个少数类样本中的第attr个属性,attr=1,2,...,d;Rd表示少数类样本集合;
γ为[0,1]之间的随机数;
xij是样本xi的第j个近邻样本,j=1,2,...,k;
xnew表示在样本xij与xi之间插值得到的样本;
共生成nt个合成样本,其中t为样本集中原始少数类样本个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911284749.2/1.html,转载请声明来源钻瓜专利网。