[发明专利]一种应用于信用卡交易反欺诈的识别方法有效
申请号: | 201911323155.8 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111105241B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 董雪梅;崔奔雷 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06F18/2431;G06F18/214 |
代理公司: | 杭州天昊专利代理事务所(特殊普通合伙) 33283 | 代理人: | 董世博 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 信用卡 交易 欺诈 识别 方法 | ||
1.一种应用于信用卡交易反欺诈的识别方法,其特征在于,具体包括如下步骤:
101)根据身份特征聚合交易特征;
102)根据地区聚合交易时间特征;
103)建立基于XGBoost、CatBoost、LightGBM三种模型对信用卡交易进行预测,得到欺诈的概率判断值;
其中XGBoost的模型具体处理公式如下:
式中是残差项,为正则项,其中γ为决策树的个数,T为叶子节点的个数,为每个叶子节点的权重值,λ为常数;
将公式(1)中改为作为式中loss函数,将改为作为式中正则项,转换后公式如下:
式中为新增的第t棵树,并将改变的值记为ft(xi);式中第t-1棵树则拟合为
进一步分解前面t-1棵树的残差平方和,与新拟合的第t棵树,将公式(2)转换为如下公式:
使得每次都求得一棵决策树时,使ft(xi)最大的减少残差值;
将公式(3)中的作为x,则ft(xi)作为Δx,Obj(t)=F(x+Δx),将其进行泰勒展开,并记对的一阶导数记为gi,二阶导数记为hi,忽略常数部分C,则得到如下公式:
其中ft(xi)为基于第t棵树的叶子节点权重的函数,则公式(4)转换表示为如下公式:
其中样本被分到了各个叶子节点上,将样本1到样本n的顺序遍历改为从叶子节点1上的样本遍历到叶子节点n上的样本,得到如下公式:
记为Gi,记为Hi,转化为如下wj的多元极值公式:
回代到公式(6)得到新的目标函数为:
根据叶子节点的分割,将分割后的部分分为L部分和R部分,得其分类后的收益公式如下:
得XGBoost的最大欺诈的概率判断值Gain;
104)根据步骤103)建立的三种模型的输出结果以皮尔逊相关系数矩阵,得到对相关性低的结果进行平均加权融合,得出最终的预测结果。
2.根据权利要求1所述的一种应用于信用卡交易反欺诈的识别方法,其特征在于:基于对客户显性和/或隐性身份特征来识别确定唯一身份的识别,统计唯一身份下的交易特征包括交易的平均金额、交易的频率、使用设备的种类。
3.根据权利要求1所述的一种应用于信用卡交易反欺诈的识别方法,其特征在于:时间特征基于地区的时间特征,按地区分类统计最高交易频段的时间,计算各个交易时间与当地高频交易时间的差值来作为判断异常交易的重要特征。
4.根据权利要求1所述的一种应用于信用卡交易反欺诈的识别方法,其特征在于:CatBoost模型将训练集随机排序,对于第p个样本,用前面p-1个样本值的统计值来代替第p个样本,具体公式如下:
其中,P和a为超参数,以减少低频类别中获得的噪音,通过排序提升的方式提高了模型的鲁棒性以及泛化能力。
5.根据权利要求1所述的一种应用于信用卡交易反欺诈的识别方法,其特征在于:步骤104)的具体步骤如下:
401)获得三个模型输出预测的皮尔逊相关系数;
402)取出步骤401)中皮尔逊相关系数低于0.99的预测结果,并且本身预测精度相近较优;
403)以相同的权重融合三个模型的预测结果输出最终结果,作为最终的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911323155.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自带灯箱的木纹展柜
- 下一篇:寄存器复位系统及芯片