[发明专利]一种基于联邦学习的信用卡交易风险预测方法有效
申请号: | 202011315912.X | 申请日: | 2020-11-22 |
公开(公告)号: | CN112418520B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 李莉;樊宇曦;林国义 | 申请(专利权)人: | 同济大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/02;G06K9/62;G06N20/10 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联邦 学习 信用卡 交易 风险 预测 方法 | ||
本发明涉及一种基于联邦学习的信用卡交易风险预测方法,包括以下步骤:1)获取作为不同本地客户端的各个银行中,关于客户信用卡交易特征数据的数据集;2)采用局部敏感哈希算法搜索各银行数据集中的相似实例;3)采用串行联邦学习环境中GBDT算法构建组合特征;4)根据组合特征和原始特征构建新的训练特征,各本地客户端以此扩展并构建新的数据集;5)各本地客户端分别采用相同的神经网络模型进行训练,并将训练好的模型参数上传到云端,云端将模型参数聚合更新后返回各本地客户端后开始下一次的训练,直至训练过程收敛,得到最终的神经网络模型完成信用卡交易风险预测结果。与现有技术相比,本发明具有隐私保护、结果准确、适用范围广等优点。
技术领域
本发明涉及金融数据安全领域,尤其是涉及一种基于联邦学习的信用卡交易风险预测方法。
背景技术
近年来,联邦学习作为一种新兴的人工智能基础技术正蓬勃发展。“联邦学习”的概念最早于2016年由谷歌研究科学家H.Brendan McMahan等提出。它是指多个客户(如移动设备、机构、组织等)在一个或多个中央服务器协作下协同进行去中心化机器学习的设置。在去中心化机器学习的过程中,联邦学习能够保证每个客户的隐私数据不出本地,从而降低了传统中心化机器学习带来的隐私泄露风险和因数据泄露带来的相应成本。另外,根据近年来的银行年报来看,信用卡的不良率及贷款坏账率都有提升,并且受疫情影响,生产工作都放缓了脚步,伴随着收入的暂停,但是仍然需要生活必须消费。而信用社会的信用卡制度,超前消费,提前预支未来收入越来越被大家所接受,疫情期间,不良贷款率以及坏账率都在增加,银行体系由于贷款增加了不少风险杠杆,一旦杠杆继续加大,将造成很严重的后果,因此,发展及时检测信用卡交易潜在风险的技术迫在眉睫。
在过去,数据动模型不动,也就是说可以从各地来购买数据,或移动数据到一个中心点,在中心点建立模型。而碍于法律法规的影响,各银行间难以跨越法律壁垒来进行联合建模,并且由于信用卡不良率与合法交易数据的比例严重失衡导致单一银行的数据库缺乏不良样本,因此希望通过联邦学习进行银行间的联合建模来改善现有的预测模型。
本发明主要应用于缺乏有效不良交易的标签的信用卡交易风险预测应用。在现实场景中,公开可用的信用卡交易数据集非常稀缺,从而为信用卡交易风险预测模型的提升带来了巨大的挑战,通过分析梯度提升决策树与逻辑回归两种模型的优缺点和互补性可以知道,逻辑回归线性模型处理速度快、对全局把握性好但是对特征要求比较高。梯度提升决策树适合处理非线性数据,其思想可以用来构造组合特征,充分挖掘数据信息,然而却不能并行进行不适合处理数据量大的数据集。
目前,在信用卡风险检测领域,还没有对如何在保护数据隐私的前提下而进行跨机构间联合建模进行相关研究工作,仅有少量研究针对如何利用单一银行数据集进行了一定的探索,Soemers等提出了一种结合决策树与上下文多臂赌博机来构建动态欺诈检测模型;Bian等人提出将Bagging与Boosting算法结合而形成一种有监督的欺诈检测模型;Meng提出基于GBDT和LR的个人信用评估模型,结果准确性相较于单一模型有显著提高。Yang等人提出了基于联邦学习和差分隐私的信用卡欺诈检测系统。但是这些研究工作仍存在着许多不足:
首先,这些工作所带来的提升都较为有限,因为所用的数据都来自单一机构,没有打破机构间的数据壁垒,从而无法达到机构间合作共赢的效果;
其次,有些工作为了保护数据隐私,应用了差分隐私方法,在训练过程中引入噪声,可能会加入了一些较为不稳定的模块,使得整个模型难以训练或是训练时间过长,降低了训练准确度,不适用于实际场景;
最后,有些工作只利用现有的单一特征,而忽略了组合特征的重要性,对模型的训练结果有一定的影响。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于联邦学习的信用卡交易风险预测方法。
本发明的目的可以通过以下技术方案来实现:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011315912.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理