[发明专利]一种基于LOF算法的互联网金融申请反欺诈识别方法在审

专利信息
申请号: 202010493203.4 申请日: 2020-06-03
公开(公告)号: CN111833174A 公开(公告)日: 2020-10-27
发明(设计)人: 江远强 申请(专利权)人: 百维金科(上海)信息科技有限公司
主分类号: G06Q40/02 分类号: G06Q40/02;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 201913 上海市崇明区长兴镇潘园公*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 lof 算法 互联网 金融 申请 欺诈 识别 方法
【说明书】:

发明提供了一种基于LOF算法的互联网金融申请反欺诈识别方法,包括采集数据并对其进行预处理;进行数据特征选择,获得LOF算法的数据集并将数据集随机划分为不同的数据子集;计算数据点的局部可达距离、局部密度可达密度以及局部离群因子LOF值;利用LOF值来判断数据点是不是离群点来作为该申请行为是否属于欺诈行为。实施本发明技术方案,有效缩短了异常点检测的运行时间,提高了高维大数据集异常值检测的效率,能够对互联网申请行为实时监控,及时准确检测发现申请异常欺诈行为,减少信贷损失,更加适合当前大数据风控的需要。

技术领域

本发明涉及互联网金融行业的风控技术领域,特别涉及。

背景技术

随着互联网金融的发展,灰产、黑产等欺诈行为的种类和方式也越来越多,据不完全统计,每年因欺诈导致的损失可达到500亿—1000亿,欺诈风险已成为互联网金融防范风险的重中之重。从统计学来说,欺诈行为相对正常行为属于离群点,在数据的散布图中,它们远离其它数据点,其属性值显著地偏离期望或常见的属性值,离群点检测是成为金融反欺诈的一种常用方法,如何有效地检测出在高度可能性的欺诈行为,成为各大金融机构的反欺诈的主要工作。

现有技术中,离群点检测方法主要有三种:基于统计的离群点检测方法(HBOS:基于直方图的异常值得分)、基于距离的离群点检测方法(如K最近邻KNN)及基于聚类的离群点检测方法(如K均值聚类K-means、DBSCAN)等,但现有技术的算法均较复杂、运算量大、时间复杂度大及精度不高等问题,对于高维大数据检测效率较低。如何减少离群点检测的计算量及运行时长成为亟待解决的技术问题。

LOF算法(Local Outlier Factor,局部离群因子)是基于密度的异常数据检测方法,该算法引入每一个数据对象的可达距离和可达密度的概念,来判断一个数据对象是否是离群点,针对数据集中的每个数据计算一个局部异常因子LOF,来反映一个数据的异常程度,因为LOF算法对密度的衡量是通过点的第k邻域来计算,仅对可能出现离群点的边界单元进行离群点的挖掘,而不是全局计算,且在样本空间数据分布不均匀的情况下也可以准确发现离群点,可以有效减少离群点需要检测的数据量、计算量以及运行时长,对于高维大数据的检测效率更高,也更加适合当前大数据风控的需要。

发明内容

为了解决上述技术问题,本发明中披露了一种基于LOF算法的互联网金融申请反欺诈识别方法,本发明的技术方案是这样实施的:

一种基于LOF算法的互联网金融申请反欺诈识别方法,包括以下步骤:步骤一:采集客户端上客户申请提现的操作埋点数据、个人基本信息以及客户授权的第三方数据;步骤二:数据预处理,包括异常值处理和归一化处理;步骤三:针对信贷欺诈的行为特征类型,进行数据特征选择,获得LOF算法的数据集,并将数据集随机划分为不同的数据子集;步骤四:基于数据子集,通过LOF算法先计算数据子集中对象p的第K距离领域,然后计算出对象p的局部可达距离;步骤五:根据局部可达距离,计算对象p的局部可达密度;步骤六:根据局部可达密度,计算对象p的局部异常因子LOF值;步骤七:递归步骤一至步骤六,在循环计算中,将获得的LOF值与设定的阈值ψ比较,LOF值小于阈值ψ的对象判定为正常点,不断剔除,LOF值大于阈值ψ的对象判定为异常点,将异常点输出。

进一步地,所述异常值处理包括剔除无关维度的数据并删除数据中的异常值。

进一步地,所述归一化处理采用离差标准化的方法。

进一步地,所述第K距离领域、局部可达距离和局部可达密度只在对象p所在的数据子集中计算。

进一步地,所述阈值ψ依靠经验值或者实际业务变化动态设定和调整。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百维金科(上海)信息科技有限公司,未经百维金科(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010493203.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top