[发明专利]一种基于过采样改进svdd的银行客户交易行为异常识别方法在审
申请号: | 202010137063.7 | 申请日: | 2020-03-02 |
公开(公告)号: | CN111369339A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 杨健颖 | 申请(专利权)人: | 深圳索信达数据技术有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q20/40 |
代理公司: | 深圳市千纳专利代理有限公司 44218 | 代理人: | 黄良宝 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 采样 改进 svdd 银行 客户 交易 行为 异常 识别 方法 | ||
1.一种基于过采样改进svdd的银行客户交易行为异常识别方法,其特征在于:包括以下步骤:
S1,给定银行客户交易行为的原始数据,对原始数据进行一致性检查,清除无效数据和重复数据,填补缺失值,并将类别变量转化为数值型变量,根据原始数据中记录的结果,将原始数据分为有异常行为和暂时没有出现异常行为两类;将暂时没有出现异常行为这类视作不知是否有异常;
S2,设置一个数值p,使用smote过采样算法将数据中有异常行为的数据扩充p倍;
S3,对扩充p倍后的有异常行为的数据建立svdd模型,计算svdd模型的球心a和半径R;
S4,计算不知是否异常行为的数据到svdd模型球心a的距离,将该距离小于svdd模型半径R的交易行为判断为异常行为,否则判断为无异常行为。
2.根据权利要求1所述的一种基于过采样改进svdd的银行客户交易行为异常识别方法,其特征在于,所述步骤S2包括:
设有异常行为的数据集为Q,共有q个样本;
计算有异常行为的数据集Q中的每一个样本xi(i=1,2,...q)的m近邻点,从这m个近邻点中随机选取一个样本点xit再生成一个0至1的随机数λj,基于xi生成的第j个新样本点
对每一个样本xi进行p次线性插值运算,每次生成一个新样本,得到基于smote过采样算法扩充p倍后的有异常行为数据集。
3.根据权利要求1所述的一种基于过采样改进svdd的银行客户交易行为异常识别方法,其特征在于,所述步骤S3包括:
用(x,y)表示有异常行为的数据集,x表示特征,y表示有异常;对有异常行为的数据集(x,y)构建一个超球体,该超球体描述为使得(xi-a)T(xi-a)≤R2+ξi,其中C是惩罚参数,ξi是松弛变量;
将超球体的描述转化为如下形式:L=∑αiK(xi,xj)-∑αiαjK(xi,xj),其中K是核函数,αi是拉格朗日乘子,计算超球体的球心a和半径R;
计算超球体的半径R2=K(xi,xi)-2∑αiK(xi,xj)+∑∑αiαjK(xi,xj)和球心a=∑αixi;
计算不知是否有异常行为的数据到球心a的距离,将该距离小于超球体半径R的行为判断为异常,将识别出来的异常行为报告到验证模块做进一步的安全验证。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳索信达数据技术有限公司,未经深圳索信达数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010137063.7/1.html,转载请声明来源钻瓜专利网。