[发明专利]一种基于k-近邻算法的金融反欺诈方法在审
申请号: | 201811230707.6 | 申请日: | 2018-10-22 |
公开(公告)号: | CN109360099A | 公开(公告)日: | 2019-02-19 |
发明(设计)人: | 王涛;陈俊豪;程良伦 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q20/40 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交易信息 近邻算法 欺诈 数据库 实时获取 金融 客户 客户交易信息 归一化处理 机器学习 金融交易 金融领域 金融欺诈 欺诈行为 正常交易 点距离 识别率 数据点 迭代 存储 递增 分类 概率 统计 | ||
1.一种基于k-近邻算法的金融反欺诈方法,其特征在于,包括以下步骤:
S1:建立存储客户常用信息的数据库A,将客户近期金融信息存入数据库A中;
S2:建立数据库B存储采集到的客户交易信息,实时获取客户的交易信息;
S3:将获取的交易信息进行归一化处理;
S4:根据归一化处理后的数据,计算当前数据点与数据库A中数据之间的距离;
S5:将计算所得的所有数据按照递增的顺序排列,选取与当前点距离最小的k个点;
S6:迭代统计k个点所在正常交易事件和欺诈事件的次数,计算出两种事件出现的概率大小;
S7:比较判断返回概率大者作为当前判断的结果,即作为该金融交易行为是否属于欺诈行为的结果。
2.根据权利要求1所述的一种基于k-近邻算法的金融反欺诈方法,其特征在于,在步骤S1中,所述客户近期金融信息包括最近三个月转入金额、最近三个月转出金额、最近三个月最大消费金额、最近三个月最小消费金额。
3.根据权利要求1所述的一种基于k-近邻算法的金融反欺诈方法,其特征在于,在步骤S2中,通过多种数据采集方法进行数据采集服务,将数据传递至分布式消息队列,引入Storm框架进行数据的清洗、统计,将处理完的数据存储在分布式SQL数据库中,即数据库B中。
4.根据权利要求1所述的一种基于k-近邻算法的金融反欺诈方法,其特征在于,所述步骤S3具体为:
S31:取出数据库B中的数据与数据库A中的数据进行逐一匹配;
S32:将匹配后的数据进行归一化处理,具体公式为:
其中,CalValue为归一化后的数据;value为计算点的数据;minvalue为所有数据中的最小值;maxvalue为所有数据中的最大值;将任意取值范围数值转到区间0-1之间。
5.根据权利要求1所述的一种基于k-近邻算法的金融反欺诈方法,其特征在于:在所述步骤S5中,采用冒泡排序法的方法,将计算所得的所有数据按照递增的顺序排列起来。
6.根据权利要求5所述的一种基于k-近邻算法的金融反欺诈方法,其特征在于:在所述步骤S5中,将排序完的k个数据记为:k1,k2,…,ki,i为迭代次数;
在步骤S6中,假设属于欺诈次数为a,正常交易次数为b;初始化迭代次数i的值为1,欺诈次数a为0,正常交易次数b为1;
判断ki属于何种事件,其中i为不大于20的整数;若ki为欺诈事件,则a=a+1;若ki为正常交易事件,则b=b+1;直至迭代完成,记录下a、b的值。
7.根据权利要求6所述的一种基于k-近邻算法的金融反欺诈方法,其特征在于:所述步骤S7的具体步骤为:
S71:通过古典概型概率计算公式计算当前数据点属于欺诈事件的概率为属于正常交易事件的概率为
S72:比较P(a)、P(b)的大小,若P(a)>P(b),则判断该笔交易情况属于欺诈行为;若P(a)<P(b),则判断该笔交易属于正常交易行为。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811230707.6/1.html,转载请声明来源钻瓜专利网。