[发明专利]一种欺诈识别模型训练方法、欺诈识别方法及装置在审
申请号: | 201811432681.3 | 申请日: | 2018-11-28 |
公开(公告)号: | CN109544190A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 郭豪;孙善萍;任鑫涛;蔡准;孙悦;郭晓鹏 | 申请(专利权)人: | 北京芯盾时代科技有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06N3/08 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 杨奇松 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 欺诈 样本用户 模型训练 特征向量 样本数据 标注信息 神经网络 标注 历史操作信息 模型训练过程 人工标注 分类器 无监督 准确率 构建 申请 工作量 监督 | ||
本申请提供了一种欺诈识别模型训练方法、欺诈识别方法及装置,其中,欺诈识别模型训练方法包括:基于获取的第一样本用户和第二样本用户的历史操作信息及第二样本用户的欺诈标注信息,构建第一样本用户的第一特征向量和第二样本用户的第二特征向量;基于第一特征向量对第一神经网络进行无监督预训练;并基于第二特征向量和对应欺诈标注信息,对经过预训练的第一神经网络和分类器,进行有监督训练,得到欺诈识别模型。本申请实施例能够通过大量无标注的样本数据和少量有标注的样本数据训练得到欺诈识别模型,减少在模型训练过程中对样本数据进行人工标注的工作量的同时,能够提高模型训练的效率以及欺诈识别模型的识别准确率。
技术领域
本申请涉及机器学习技术领域,具体而言,涉及一种欺诈识别模型训练方法、欺诈识别方法及装置。
背景技术
互联网的快速发展以及智能终端的普及,使得人们在通过多种业务渠道的电子银行远程办理查询余额、转账、购物支付、理财等业务时获得了极大的便捷,人们无论在任何时间、任何地点,不需要到银行柜面,只需轻松动一下手指即可通过电子银行进行汇款转账、定活互转、信用卡账单及明细查询、信用卡还款、理财/基金购买、生活缴费等多种金融业务,效率得到了极大的提高。但是电子银行在为用户提供便捷服务的同时,也存在很多的安全隐患。
调查显示,网络犯罪每年给全球带来高达4450亿美元的经济损失,日益复杂并向不同行业渗透。在国内,网络诈骗的黑色产业链规模超过1100亿元,从业人员超过160万人。据中国互联网协会发布的数据显示,63.4%的网民通话记录、网上购物记录等信息遭泄露;78.2%的网民个人身份信息曾被泄露。欺诈者窃取到受害人的信息之后不断的进行暴力破解、账户信息窃取、账户信息盗用、盗转资金等行为,个人信息的泄露,给诈骗分子实现精准诈骗带来了很大的便利,使得诈骗分子可以实现精准诈骗,单个诈骗金额不断攀升,其欺诈行为已从单一个体行为,发展成为一个组织严密、专业分工明确的黑色产业链条,为银行发展网络金融业务带来了严峻挑战。
为了增强电子银行的安全性,现有技术中采用传统的有监督的训练方法对机器学习模型进行训练,但在进行有监督的训练时,需要有标签的样本进行训练,而标注工作需要纯人工来完成的,存在耗时费力的问题。但如果使用少量的有标签样本数据对机器学习模型进行训练,又会由于样本数据过少,造成得到的欺诈识别模型识别准确率低的问题。
发明内容
有鉴于此,本申请实施例的目的在于提供一种欺诈识别模型训练方法、欺诈识别方法及装置,能够通过大量无标注的样本数据和少量有标注的样本数据训练得到欺诈识别模型,减少在模型训练过程中对样本数据进行人工标注的工作量的同时,能够提高模型训练的效率以及欺诈识别模型的识别准确率。
第一方面,本申请实施例提供了一种欺诈识别模型训练方法,包括:
获取多个第一样本用户的历史操作信息;以及获取多个第二样本用户的历史操作信息,和各个所述第二样本用户分别对应的欺诈标注信息;
根据所述第一样本用户的历史操作信息,构建能够用于表征所述第一样本用户操作行为特征的第一特征向量;以及根据所述第二样本用户的历史操作信息,构建能够用于表征所述第二样本用户操作行为特征的第二特征向量;
将所述第一特征向量输入至结构对称的第一神经网络和第二神经网络,对所述第一神经网络进行无监督预训练;其中,所述第一神经网络用于对所述第一特征向量进行编码;所述第二神经网络用于对经过编码后的所述第一特征向量进行解码;
将所述第二特征向量输入至经过预训练的所述第一神经网络和分类器,基于所述第二特征向量和对应的所述欺诈标注信息,对经过预训练的所述第一神经网络和所述分类器进行有监督训练,得到欺诈识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京芯盾时代科技有限公司,未经北京芯盾时代科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811432681.3/2.html,转载请声明来源钻瓜专利网。