[发明专利]一种基于联邦学习的信用卡交易风险预测方法有效
申请号: | 202011315912.X | 申请日: | 2020-11-22 |
公开(公告)号: | CN112418520B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 李莉;樊宇曦;林国义 | 申请(专利权)人: | 同济大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/02;G06K9/62;G06N20/10 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联邦 学习 信用卡 交易 风险 预测 方法 | ||
1.一种基于联邦学习的信用卡交易风险预测方法,其特征在于,包括以下步骤:
1)获取作为不同本地客户端的各个银行中,关于客户信用卡交易特征数据的数据集,每个银行数据集中每条实例对应的原始特征的维度相同;
2)采用局部敏感哈希算法搜索各银行数据集中的相似实例;
3)采用串行联邦学习环境中GBDT算法构建组合特征,当一个实例与多个其他实例相似时,该实例重要性较高,则采用梯度表示该实例的重要性,在每个本地客户端进行GBDT模型训练时,采用加权梯度进行训练,具体包括以下步骤:
31)每个数据拥有方更新本地实例的梯度,当数据拥有方Pm在第t次迭代中构建新树时,加权梯度提升决策树最小化目标函数为:
其中,为第t次迭代中的目标,为数据拥有方Pm的第q个实例,Im为数据拥有方Pm的实例集合,Gmq和Hmq分别为与实例处相似实例在损失函数处的一阶与二阶梯度之和,且包含该实例本身的梯度,Ω(ft)为对模型的正则化惩罚项,γ和λ均为超参数,对应一颗决策树,为包含在客户端n的实例里与实例相似的所有实例ID的集合,为第n个客户端的第i个节点在损失函数上的一阶梯度信息,为第n个客户端的第i个节点在损失函数上的二阶梯度信息,Tl为叶子节点的总数,w为叶子节点的权重;
32)对于数据拥有方Pm的每个实例,其他各数据拥有方将发送对应相似实例的聚合梯度到数据拥有方Pm;
33)数据拥有方Pm在接收到聚合梯度后进行加权求和得到加权梯度,并根据该加权梯度训练构建一棵决策树,由此获取组合特征;
4)根据组合特征和原始特征构建新的训练特征,各本地客户端以此扩展并构建新的数据集;
5)各本地客户端分别采用相同的神经网络模型进行训练,并将训练好的模型参数上传到第三方云端,云端将模型参数聚合更新后返回各本地客户端后开始下一次的训练,直至训练过程收敛,得到最终的神经网络模型完成信用卡交易风险预测结果。
2.根据权利要求1所述的一种基于联邦学习的信用卡交易风险预测方法,其特征在于,所述的步骤1)中,每条实例的特征包括基础字段、信用字段和交易字段,所述的基础字段包括性别、年龄、婚姻状况和地区以及学历数据,所述的信用字段包括账户信用等级评定、是否通过交易密码验证、是否通过短信身份验证以及是否通过人脸识别验证数据,所述的交易字段包括交易金额、是否分期、交易手续费、交易时间和交易笔数数据。
3.根据权利要求1所述的一种基于联邦学习的信用卡交易风险预测方法,其特征在于,所述的步骤2)具体包括以下步骤:
21)给定L个随机生成的p稳定哈希函数,每个本地客户端,即数据拥有方,根据生成的p稳定哈希函数获取其所有实例对应的哈希值;
22)以每个实例的ID及其哈希值作为输入,采用AllReduce运算构建L个全局哈希表并广播;
23)各数据拥有方根据广播的全局哈希表获得数据集中的相似实例。
4.根据权利要求3所述的一种基于联邦学习的信用卡交易风险预测方法,其特征在于,所述的步骤23)中,通过Reduce操作将拥有相同的哈希值实例的ID进行合并,对于数据拥有方Pm的给定实例另一数据拥有方Pj中的相似实例为具有相同哈希值最高计数的实例。
5.根据权利要求1所述的一种基于联邦学习的信用卡交易风险预测方法,其特征在于,所述的步骤33)中,GBDT模型训练的终止条件根据每棵决策树最大叶子节点数目以及决策树个数决定,训练好的GBDT模型叶子节点的输出即为组合特征向量。
6.根据权利要求1所述的一种基于联邦学习的信用卡交易风险预测方法,其特征在于,所述的步骤4)中,新的训练特征由组合特征和原始特征合并形成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011315912.X/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理