[发明专利]基于无监督学习的反欺诈方法、装置、计算机设备及存储介质有效
申请号: | 201910011758.8 | 申请日: | 2019-01-07 |
公开(公告)号: | CN109992578B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 金晓辉;阮晓雯;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2455;G06F16/248;G06F18/213;G06F18/2321;G06Q30/018;G06Q40/08 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 刘贻盛 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 欺诈 方法 装置 计算机 设备 存储 介质 | ||
1.一种基于无监督学习的反欺诈方法,其特征在于,所述方法包括:
根据预设的规则引擎从业务数据中筛选出具有高欺诈风险的数据;
根据所述具有高欺诈风险的数据,和所述具有高欺诈风险的数据所对应的用户的历史行为数据构建多维特征;
根据所述具有高欺诈风险的数据,利用多维尺度变换模型,将构建的多维特征在低维空间中进行可视化以得到多个数据点;
从可视化后的多个数据点中确定正常点和异常点,将所述异常点确定为潜在欺诈点;
根据聚类算法,对所述正常点和所述潜在欺诈点进行聚类,以得到聚类后的簇;
计算得到每个簇中的潜在欺诈点所占的比例;
将潜在欺诈点所占比例高于预设比例的簇作为目标簇;
将所述目标簇中的每个点所对应的业务数据确定为欺诈数据;
所述从可视化后的多个数据点中确定正常点和异常点,将所述异常点确定为潜在欺诈点,包括:
获取可视化后的所有点的第一坐标值,第二坐标值,......,第k坐标值,其中,k表示可视化的空间的维数;
根据所有点的第一坐标值确定x取值范围,以使得第一坐标值落入x取值范围的点的占比达到第一预设比例;根据所有点的第二坐标值确定y取值范围,以使得第二坐标值落入y取值范围的点的占比达到第二预设比例;......;根据所有点的第k坐标值确定k取值范围,以使得第k坐标值落入k取值范围的点的占比达到第k预设比例;
根据确定的x取值范围、y取值范围、......、k取值范围,确定一个空间;
将落入该空间内的点确定为正常点,将未落入该空间内的点确定为异常点,将所述异常点确定为潜在欺诈点;
所述根据聚类算法,对所述正常点和所述潜在欺诈点进行聚类,以得到聚类后的簇,包括:
设置半径值和距离值;
根据所设置的半径值和距离值,将所述正常点和所述潜在欺诈点分类标记为核心点、边界点、噪音点,并删除噪音点;
将距离不超过所设置的距离值的点相互连接,形成一个簇,该簇中包括部分核心点和该部分核心点预设距离值邻域内的边界点,如此得到多个簇,将得到的多个簇作为聚类后的簇。
2.根据权利要求1所述的方法,其特征在于,所述从可视化后的多个数据点中确定正常点和异常点,将所述异常点确定为潜在欺诈点,包括:
获取可视化后的所有点,根据可视化后的所有点拟合出一个阈值函数;
根据阈值函数确定正常点和异常点,将所述异常点确定为潜在欺诈点。
3.根据权利要求1所述的方法,其特征在于,所述根据所述具有高欺诈风险的数据,利用多维尺度变换模型,将构建的多维特征在低维空间中进行可视化以得到多个数据点,包括:
将多维特征中的非度量型变量特征,通过哑变量转换的方式,转换为度量型变量特征;
根据所述具有高欺诈风险的数据以及转换后的多维度量型变量特征,利用多维尺度变换进行处理,以在低维空间中进行可视化以得到多个数据点。
4.根据权利要求3所述的方法,其特征在于,所述根据所述具有高欺诈风险的数据以及转换后的多维度量型变量特征,利用多维尺度变换进行处理,以在低维空间中进行可视化以得到多个数据点,包括:
获取具有高欺诈风险的数据的条数n,获取多维度量型变量特征的维度q,将n条q维的特征数据作为样本数据,得到矩阵X;其中,矩阵
根据矩阵X计算欧式距离矩阵D,其中,
根据欧式距离矩阵D构造矩阵A,其中,
根据矩阵A计算内积矩阵B,其中,其中,为矩阵中第i行的所有值的均值,为矩阵A中第j列的所有值的均值,为矩阵A中所有值的均值;
计算内积矩阵B的特征值和特征向量,其中,特征值按照从大到小的顺序排序;
确定可视化的空间的维数k;
重构其中Ek是内积矩阵B的前k个特征向量组成的矩阵,Λk是前k个特征值组成的对角矩阵;
将重构出的值作为k维空间中的点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910011758.8/1.html,转载请声明来源钻瓜专利网。