[发明专利]一种基于k-近邻算法的金融反欺诈方法在审
申请号: | 201811230707.6 | 申请日: | 2018-10-22 |
公开(公告)号: | CN109360099A | 公开(公告)日: | 2019-02-19 |
发明(设计)人: | 王涛;陈俊豪;程良伦 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q20/40 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交易信息 近邻算法 欺诈 数据库 实时获取 金融 客户 客户交易信息 归一化处理 机器学习 金融交易 金融领域 金融欺诈 欺诈行为 正常交易 点距离 识别率 数据点 迭代 存储 递增 分类 概率 统计 | ||
本发明提供一种基于k‑近邻算法的金融反欺诈方法,包括以下步骤:建立存储着客户常用信息的数据库A、实时获取客户的交易信息的数据库B,实时获取客户的交易信息;将交易信息进行归一化处理;计算当前数据点与数据库A中数据之间的距离;将计算所得的所有数据按照递增的顺序排列,选取与当前点距离最小的k个点;迭代统计k个点所在正常交易事件和欺诈事件的次数,计算出两种事件出现的概率;作为该金融交易行为是否属于欺诈行为的结果。本发明提供的一种基于k‑近邻算法的金融反欺诈方法,采用k‑近邻算法对客户交易信息数据进行分类,将机器学习与金融领域相结合,有效提升了金融欺诈识别率,降低了金融风险。
技术领域
本发明涉及金融反欺诈领域,更具体的,涉及一种基于k-近邻算法的金融反欺诈方法。
背景技术
随着金融行业发展,通过各种各样的渠道进行金融服务交易的情况越来越普及,同时也伴随着许多不法分子利用各平台的漏洞进行各种欺诈行为,但是由于金融产品的可选择性过于充分,但与之对应的风险防御措施没有到位,而且客户对于各种金融产品的了解不够深入,所以金融欺诈的事件频繁发生,给银行企业以及金融产品客户造成了巨大损失。因此,进行金融反欺诈的风控工作十分重要。
针对于金融反欺诈问题,最常见的风险审查工作一般情况下是由人工进行的,基于这种方法进行金融反欺诈虽然能在金融反欺诈取得很好的效果,但是人工审查具有不确定性和不稳定性,况且每天金融交易的数量十分巨大,需要耗费巨大的人力资源,无法真正的适用市场。为了克服这种困难,先前有人提出一种基于朴素贝叶斯模型的金融反欺诈方法,但这种方法需要知道先验概率,且先验概率很多时候取决于假设,因假设的模型具有不确定性,因此在某些特定的情况下会因为先验模型的原因导致预测效果不佳,对金融反欺诈的效果较差,难以投入市场使用。
发明内容
本发明为克服现有的金融反欺诈方法存在预测效果不佳,对金融反欺诈的效果较差,难以投入市场使用的技术缺陷,提供一种基于k-近邻算法的金融反欺诈方法。
为解决上述技术问题,本发明的技术方案如下:
一种基于k-近邻算法的金融反欺诈方法,包括以下步骤:
S1:建立存储客户常用信息的数据库A,将客户近期金融信息存入数据库A中;
S2:建立数据库B存储采集到的客户交易信息,实时获取客户的交易信息;
S3:将获取的交易信息进行归一化处理;
S4:根据归一化处理后的数据,计算当前数据点与数据库A中数据之间的距离;
S5:将计算所得的所有数据按照递增的顺序排列,选取与当前点距离最小的k个点;
S6:迭代统计k个点所在正常交易事件和欺诈事件的次数,计算出两种事件出现的概率大小;
S7:比较判断返回概率大者作为当前判断的结果,即作为该金融交易行为是否属于欺诈行为的结果。
其中,在步骤S1中,所述客户近期金融信息包括最近三个月转入金额、最近三个月转出金额、最近三个月最大消费金额、最近三个月最小消费金额。
其中,在步骤S2中,通过多种数据采集方法进行数据采集服务,将数据传递至分布式消息队列,引入Storm框架进行数据的清洗、统计,将处理完的数据存储在分布式SQL数据库中,即数据库B中。
其中,所述步骤S3具体为:
S31:取出数据库B中的数据与数据库A中的数据进行逐一匹配;
S32:将匹配后的数据进行归一化处理,具体公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811230707.6/2.html,转载请声明来源钻瓜专利网。