[发明专利]反欺诈方法、电子装置及计算机可读存储介质有效
申请号: | 201811023310.X | 申请日: | 2018-09-03 |
公开(公告)号: | CN109284371B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 何博;古立夫;吕琦 | 申请(专利权)人: | 平安证券股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06Q20/40 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 欺诈 方法 电子 装置 计算机 可读 存储 介质 | ||
1.一种反欺诈方法,其特征在于,所述方法包括步骤:
读取第一时间内的用户日志数据,并对用户日志数据进行清洗;
解析清洗后的用户日志数据得到每个用户的一个或多个操作行为序列,过滤掉无效的操作行为序列,得到的有效操作行为序列为训练样本句子;
将所述训练样本句子转换为词袋向量,利用词频模型将所述训练样本句子的词袋向量转换为词频向量,对该词频向量进行降维得到第一向量形成的样本空间;
对所述第一向量进行第一聚类,得到该第一时间内用户操作日志数据的分类类别及各类别对应的主题标签;
读取第二时间内的用户日志数据,对数据进行清洗、解析得到该第二时间内的用户操作行为序列,将用户操作行为序列转换为词频向量后利用矩阵变换映射到样本空间,得到该第二时间对应的第二向量;
计算该第二时间内对应的第二向量与所述每个分类类别中的第一向量之间的欧氏距离,根据最小距离值确定该第二时间内对应的第二向量所属的分类类别并标注相应的主题标签;
在该第二时间对应的第二向量中加入时间维度,对每个类别中加入时间维度的第二向量进行第二聚类,根据第二聚类结果识别出每个类别中代表相似时间具有相似操作的第三向量;
结合所述第三向量相关联用户的基本信息,生成所述相关联用户的关系图,根据关系图中各用户与其他用户的关联关系判断各用户是否存在欺诈嫌疑。
2.如权利要求1所述的反欺诈方法,其特征在于,将所述训练样本句子转换为词袋向量,利用词频模型将所述训练样本句子的词袋向量转换为第一向量,对该词频向量进行降维得到第一向量形成的样本空间的步骤包括:
通过词袋模型得到每个训练样本句子中各操作代码的出现次数;
利用词频-逆词频算法计算得到每个训练样本句子中各操作代码的出现次数对应的词频;
基于计算得到的词频,将所有样本句子构成m行、n列的样本矩阵,m代表样本句子的总数,n代表每个样本句子包含的操作代码的总数,矩阵中每一行的数值为样本句子各操作代码的词频,其中,m、n为正整数;
利用奇异值分解算法对所述样本矩阵进行分解,得到每个样本句子降维后的第一向量形成的样本空间。
3.如权利要求1或2所述的反欺诈方法,其特征在于,对所述第一向量进行的第一聚类的步骤包括:
视第一时间降维后得到的第一向量集合中的每个向量为一个点,利用局部异常点检查算法标注出集合中的正常点及异常点;
利用层次聚类算法对正常点进行分类,得到正常点的分类类别及主题标签;
计算异常点与正常点之间的欧氏距离,根据最小距离值将异常点划分到正常点所属的分类类别并标注相应的主题标签。
4.如权利要求1或2所述的反欺诈方法,其特征在于,每条用户日志包括用户的一个或多个操作行为及代表每个操作行为的操作代码。
5.如权利要求4所述的反欺诈方法,其特征在于,所述操作行为序列,是对用户的对话流进行分割、截取出的基于单一目的用户操作行为。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安证券股份有限公司,未经平安证券股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811023310.X/1.html,转载请声明来源钻瓜专利网。