[发明专利]一种基于网络链接回溯的反欺诈预测方法及系统有效
申请号: | 202010925813.7 | 申请日: | 2020-09-07 |
公开(公告)号: | CN111784360B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 衣得平;吴蕴初;姜一帆;谭世书 | 申请(专利权)人: | 北京江融信科技有限公司 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06Q40/02 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 张彩珍 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 链接 回溯 欺诈 预测 方法 系统 | ||
1.一种基于网络链接回溯的反欺诈预测方法,该反欺诈预测方法包括以下步骤:
根据第一网络链接获取用户唯一标识;
对所述用户唯一标识进行加密以生成第二网络链接;
根据所述用户唯一标识获取所述第二网络链接在历史时间段内的标识去重数量;
根据所述标识去重数量对历史推广内容的历史行为进行特征分析,以获得第一分析结果;根据所述标识去重数量对历史反欺诈内容的历史行为进行特征分析,以获得第二分析结果;
将所述第一、第二分析结果以及历史参考行为特征信息进行融合以生成反欺诈预测模型;
利用所述反欺诈预测模型预测网络链接的新用户的行为;
其中,所述第一分析结果包括第二网络链接的方差值、用户当前时间的平均值、最大值、最小值和活跃用户群;所述第二网络链接的方差值是通过对同一个第二网络链接的历史统计量进行方差计算所获得的;所述用户当前时间的平均值、最大值和最小值是通过对同一个第二网络链接当前时间的统计量与历史不同阈值时间的统计量进行逐一比较所获得的;
所述活跃用户群是通过以下子步骤获得的:对每个用户id的分享链接数量所对应的关联点击人数进行分箱处理以获得第一区域范围;当用户群的用户活跃数量大于等于所述第一区域范围时,则将该用户群定义为所述活跃用户群;
所述第二分析结果是通过以下子步骤获得的:对预设的欺诈比进行分箱处理,以得到第二区域范围;当用户群的欺诈比属于所述第二区域范围时,则判断该用户群为欺诈群;
所述反欺诈预测模型是通过以下子步骤获得的:
基于所述第一、第二分析结果和历史参考行为特征信息,将与第二网络连接有关的用户进行标记以得到风险标签;带有风险标签的用户包括低风险、中风险、高风险用户;
将带有风险标签的用户的行为作为训练样本,基于机器学习模型中根据用户信贷结果表现构建逾期智能算法模型;
将所述训练样本输入所述逾期智能算法模型,并以用户设备信息指标为特征,以用户信贷结果表现是否逾期为标识,对所述逾期智能算法模型进行训练,以生成所述反欺诈预测模型;
其中,所述训练样本包括网络链接点击人数、网络链接开启时间、网络链接点击次数和用户设备信息指标;
所述网络链接的新用户的行为是通过以下子步骤获得的:根据第一、第二区域范围对用户类群进行分类;
利用所述反欺诈预测模型并基于用于类群的分类结果预测网络链接的新用户的行为。
2.根据权利要求1所述的反欺诈预测方法,其特征在于,采用加密算法并只对所述用户唯一标识进行加密以生成所述第二网络链接。
3.根据权利要求1所述的反欺诈预测方法,其特征在于,所述标识去重数量是通过以下子步骤产生的:
获取多个历史时间段内的相同的所述第二网络链接;
根据相同的所述第二网络链接产生所述标识去重数量。
4.根据权利要求1所述的反欺诈预测方法,其特征在于,所述标识去重数量是通过以下子步骤产生的:
获取多个历史时间段内的不同的所述第二网络链接;
根据不同的所述第二网络链接产生所述标识去重数量。
5.一种基于网络链接回溯的反欺诈预测系统,该反欺诈预测系统包括第一获取模块、加密模块、第二获取模块、第一分析模块、第二分析模块、融合模块和预测模块;其中,
所述第一获取模块用于根据第一网络链接获取用户唯一标识;
所述加密模块对所述用户唯一标识进行加密以生成第二网络链接;
所述第二获取模块根据所述用户唯一标识获取所述第二网络链接在历史时间段内的标识去重数量;
所述第一分析模块根据所述标识去重数量对历史推广内容的历史行为进行特征分析,以获得第一分析结果;
所述第二分析模块根据所述标识去重数量对历史反欺诈内容的历史行为进行特征分析,以获得第二分析结果;
所述融合模块将所述第一、第二分析结果以及历史参考行为特征信息进行融合以生成反欺诈预测模型;
所述预测模块利用所述反欺诈预测模型预测网络链接的新用户的行为;
其中,所述第一分析结果包括第二网络链接的方差值、用户当前时间的平均值、最大值、最小值和活跃用户群;所述第二网络链接的方差值是通过对同一个第二网络链接的历史统计量进行方差计算所获得的;所述用户当前时间的平均值、最大值和最小值是通过对同一个第二网络链接当前时间的统计量与历史不同阈值时间的统计量进行逐一比较所获得的;
所述第一分析模块通过执行以下操作将用户群定义为活跃用户群:对每个用户id的分享链接数量所对应的关联点击人数进行分箱处理以获得第一区域范围;当用户群的用户活跃数量大于等于所述第一区域范围时,则将该用户群定义为所述活跃用户群;
所述第二分析模块通过执行以下操作获得所述第二分析结果:对预设的欺诈比进行分箱处理,以得到第二区域范围;当用户群的欺诈比属于所述第二区域范围时,则判断该用户群为欺诈群;
所述融合模块包括标记模块、构建模块和训练模块;其中,
所述标记模块基于所述第一、第二分析结果和历史参考行为特征信息,将与第二网络连接有关的用户进行标记以得到风险标签,带有风险标签的用户包括低风险、中风险、高风险用户;
所述构建模块将带有风险标签的用户的行为作为训练样本,基于机器学习模型并根据用户信贷结果表现构建逾期智能算法模型;
所述训练模块用于将所述训练样本输入所述逾期智能算法模型,并以所述用户设备信息指标为特征,以用户信贷结果表现是否逾期为标识,对所述逾期智能算法模型进行训练,以生成所述反欺诈预测模型;
其中,所述训练样本包括网络链接点击人数、网络链接开启时间、网络链接点击次数和用户设备信息指标;
所述预测模块通过执行以下操作以预测网络链接的新用户的行为:
根据第一、第二区域范围对用户类群进行分类;
利用所述反欺诈预测模型并基于用于类群的分类结果预测网络链接的新用户的行为。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京江融信科技有限公司,未经北京江融信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010925813.7/1.html,转载请声明来源钻瓜专利网。