[发明专利]一种基于生成对抗网络的金融交易数据的欺诈检测方法有效
申请号: | 201910525239.3 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110414780B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 章昭辉;蒋昌俊;王鹏伟;杨丽俊 | 申请(专利权)人: | 东华大学 |
主分类号: | G06Q10/0635 | 分类号: | G06Q10/0635;G06Q40/03;G06Q40/04;G06F16/215;G06F16/2458 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于长短期记忆网络和生成对抗网络的数据生成方法。本发明提出的数据生成方法,可以有效地自然解决样本不均衡问题。从实用性角度出发,通过长短期记忆网络处理交易的时间序列特征,添加基于Wasserstein距离和特征惩罚的约束优化目标函数,有效地预防模式坍塌问题;从数据的相关性角度横向验证生成数据的可靠性,从数据分布的角度纵向验证生成数据的分布,建议了基于LSTM‑GAN的负样本交易生成框架,为解决欺诈交易检测中负样本不足提供了技术支持。 | ||
搜索关键词: | 一种 基于 生成 对抗 网络 金融交易 数据 欺诈 检测 方法 | ||
【主权项】:
1.一种基于生成对抗网络的金融交易负样本生成方法,其特征在于,包括以下步骤:(1)建立需要生成的样本数据集通过抽样的方法从交易负样本数据中抽取数据集,将数据集经过数据预处理后得到交易负样本数据集;(2)建立基于LSTM‑GAN模型的数据生成方法LSTM‑GAN模型为生成器和判别器的极大极小博弈,LSTM‑GAN模型的LSTM层学习金融序列之间的特征关联,生成器通过与判别器对抗学习来覆盖实际数据分布,并且在目标函数中添加特征惩罚以确保生成结果受到约束;在生成器中,LSTM层与输入噪声分布连接,将输入噪声映射为交易间的特征关系,经过MLP层后,生成每一笔交易;在判别器中,LSTM层对输入进行侦测建模,将输入映射为特征向量,最后通过浅层神经网络,将标记为0和1的输入数据区分出来;LSTM‑GAN模型训练完成后,通过saver.save函数将TensorFlow参数保存;(3)建立基于数据分布和数据相关性的数据验证评估模型,将步骤(2)中得到的生成器生成的数据,作为模型结构的输入,多次抽样计算模型的综合评估得分,包括以下步骤:S301、网络模型读取与数据生成对于训练好的LSTM‑GAN模型,通过saver.restore将TensorFlow参数保存文件ckpt加载到模型中,还原得到生成器模型;抽样生成不同批的交易负样本数据;同时从原始负样本数据集中抽样得到同样大小的样本数据集;S302、数据分布验证对原始数据draw和生成数据dgen,寻找在样本空间上的连续函数,求不同分布的样本在连续函数f上的均值,均值作差,得到两个分布对应的均值差异mean discrepancy,找出使差值最小的函数f;均值差异mean discrepancy的值越小,两个分布越一致,公式表示为:f1=MMD2(Pr,Pg),式中,Pr是真实数据分布,Pg是生成数据分布,MMD2(·)表示最大评价差异;S303、数据相关性验证对于原始数据draw和生成数据dgen,计算其不同列之间的协方差矩阵S,然后计算其对应的相关系数矩阵Rr和Rg,寻找使两者差值Dif fR最小函数;如果Dif fR足够小,则认为两个分布的相关系数情况一致,公式表示为:S304、综合计算将步骤S302和步骤S303中结果加权求和,得到综合评估得分,公式表示为:w1表示S302中数据分布的权重,w2表示S303中数据相关性的权重;(4)建立分类结构,将步骤(2)中模型最终生成的数据作为分类结构的输入,训练分类结构,得到交易数据的欺诈检测结果,包括以下步骤:S401、数据集合成对于训练好的LSTM‑GAN模型,通过saver.restore将TensorFlow参数保存文件ckpt加载到模型中,还原得到生成器模型;抽样生成不同批的交易负样本数据;将生成的数据与原始数据集合并得到新的平衡数据集;S402、初始化模型设置分类结构的模型结构,输入数据进入分类结构的处理层;S403、训练模型训练二分类模型,模型将在验证数据集上评估当前模型的检测性能,如果当前性能提升小于设定阈值,模型停止更新;S404、检测结束,得到交易数据的欺诈检测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910525239.3/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理