[发明专利]一种基于多源数据联邦学习的贷款风险评估方法有效
申请号: | 202110541127.4 | 申请日: | 2021-05-18 |
公开(公告)号: | CN113240509B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 韦庆杰;李黎;刘歆;钱鹰;赵晨阳;伍曾伟 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62;G06N20/00 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 联邦 学习 贷款风险 评估 方法 | ||
1.一种基于多源数据联邦学习的贷款风险评估方法,其特征在于,该方法包括以下步骤:
S1:使用多方数据源参与到贷款风险评估任务中,分别对多方数据源进行预处理以及数据样本加密对齐;
S2:分析和提取多方数据源关于贷款风险评估相关的特征,建立贷款用户风险画像并构建贷款风险评估体系;
S3:构建基于Lightgbm的联邦学习模型,即Lightgbm树模型,使用Lightgbm树模型对多方数据源进行联合训练,同时与中心服务器交换参数,更新训练过程;具体包括以下步骤:
S31:中心服务器对训练的参数进行初始化设置,同时对各方数据源的权重也需要进行初始化设置;
S32:中心服务器利用同态加密算法生成公钥和私钥,向各方数据源发送参数,利用公钥加密传输参数;
S33:各方数据源通过同态加密算法进行加密,对中心服务器发送的加密参数进行使用私钥进行解密,然后使用Lightgbm树模型对多方数据源的特征数据与携带标签信息的数据源进行联邦训练;具体包括:各方数据源使用其本地的样本数据联合构建Lightgbm树模型,并在各训练阶段将参数进行同态加密后传递至中心服务器;
数据源在构建Lightgbm树模型时,针对各方数据源的本地数据,将其数据特征作为树模型的节点;其中要判断当前节点是否为叶子节点,若当前节点已经是叶子节点,则停止分裂将参数传递至中心服务器,由中心服务器进行判断预测结果;若当前节点为非叶子节点,则需要由中心服务器和各方数据源一起参与进行最优节点的划分;各方数据源通过比较分割点的分裂收益确定自己的最优局部分割节点,分裂收益的计算公式如下:
其中,G和H分别表示将Lightgbm梯度展开后的一阶导值和二阶导值,L表示分裂后的左节点,R表示分裂后的右节点,λ和γ为训练过程中的超参数;
然后,各方数据源通过建立梯度直方图的方式寻找最优分割节点;寻找最优分割节点过程,直到构建得到最后的叶子节点,停止训练得到多个数据参与方联合训练的Lightgbm树模型;
完整的树模型由全部的数据源的树的并集构成,即Ti∈T,i=1,2,3…,Ti表示第i个数据源的局部树模型;
S4:综合多方数据源的训练结果构建的Lightgbm树模型,预测用户的违约情况作为用户贷款风险的判别结果。
2.根据权利要求1所述的基于多源数据联邦学习的贷款风险评估方法,其特征在于,步骤S1中,所述的多方数据源包括:银行数据源、消费平台数据源、公积金管理中心数据源、房管局房产交易中心数据源、移动运营商数据源和贷款平台数据源。
3.根据权利要求1所述的基于多源数据联邦学习的贷款风险评估方法,其特征在于,步骤S1中,对数据进行预处理,包括:统计数据项缺失值比例,对缺失值进行填补,数据类型转换并使用RobustScaler进行归一化处理。
4.根据权利要求1所述的基于多源数据联邦学习的贷款风险评估方法,其特征在于,步骤S1中,所述数据样本加密对齐,包括:不同数据源在不交换数据的情况下进行样本对齐,参与训练的数据源在不交换数据的前提下找到共同的样本,将样本与特征对齐。
5.根据权利要求1所述的基于多源数据联邦学习的贷款风险评估方法,其特征在于,步骤S2中,建立贷款用户风险画像并构建贷款风险评估体系,具体包括:针对多源数据构建用户贷款风险评估的特征;各方数据源针对其本地的数据分别提取相关风险特征,并分别建立贷款用户风险画像;
使用K-means方法对特征进行聚类,通过聚类后产生的用户分群,再结合之前的特征构建用户风险画像同时建立贷款风险评估的准则,构建出贷款风险评估体系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110541127.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于调节靠背角度的加热理疗椅
- 下一篇:一种基于多方数据集的信用分类方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置