[发明专利]一种基于机器学习的电信反欺诈方法在审
申请号: | 202210034458.3 | 申请日: | 2022-01-13 |
公开(公告)号: | CN114513791A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 吴勇;顾强峰;梁晓龙;徐梦蝶;李炳;梁建斌;陈一蕾 | 申请(专利权)人: | 浙江鸿程计算机系统有限公司 |
主分类号: | H04W12/128 | 分类号: | H04W12/128;G06N20/00 |
代理公司: | 杭州之江专利事务所(普通合伙) 33216 | 代理人: | 张慧英 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 电信 欺诈 方法 | ||
本发明涉及一种基于机器学习的电信反欺诈方法,本发明旨在解决及时拦截电信诈骗的问题,目标是提前预警提前防范电信诈骗的情况,本发明利用机器学习中的LightGBM算法对正负样本进行训练和预测,并将常见的诈骗场景分为四大类,根据不同的大类分别进行建模训练,提高预测的准确性。
技术领域
本发明涉及计算机大数据分析和机器学习技术领域,尤其涉及一种基于机器学习的电信反欺诈方法。
背景技术
近几年,电信诈骗案件频发,不法分子利用向被害人群发诈骗短信、拨打诈骗电话,实时诈骗,许多电信网络诈骗犯罪案件呈有组织化发展。按工信部要求,应当建立预警监测、大数据研判等机制,防范未经用户同意或者请求发送的商业性短信息或拨打的商业性电话,防范和打击电信诈骗违法犯罪行为,维护人民群众合法权益,保障国家安全和社会安定。除了强化防诈意识,提高识骗防骗能力以外,如何快速从源头上遏制电信诈骗的发生,也是至关重要的一步。电信运营商如何通过各种技术手段,建立用户行为涉诈骚扰预测机制,构建涉诈预警分析能力,达到防范和打击电信诈骗目的,是目前存在的技术难题。如何防范电信电话诈骗,及时阻断不法分子的通话行为,预测运营商号卡的涉诈风险等级情况也是至关重要的;传统的反欺诈方法主要是利用经验和人工的规则判断针对低套餐和新入网用户在产生高话务的同时进行拦截,但无法做到提前预警和防范;现有反电信诈骗模型大多是根据人工经验或者规则判断去拦截已经有发生通话的涉诈用户,很难做到提前预警,且容易以偏概全,时长会有规则难以覆盖的诈骗号码产生。
发明内容
本发明为克服上述的不足之处,目的在于提供一种基于机器学习的电信反欺诈方法,本发明能够准确有效识别别出高风险的涉诈用户,分层分级对涉诈用户进行预警、核验和关停处置。
本发明是通过以下技术方案达到上述目的:一种基于机器学习的电信反欺诈方法,包括如下步骤:
(1)根据历史所有的通报号码和通报的内容分析梳理,不同场景梳理,将潜在电信诈骗用户细分,深入挖掘用户分群,刻画出目标用户的特征;
(2)进行数据采集,针对现有存量用户采集其各个维度的特征,从用户的基本属性,通话行为数据,套餐入网信息,消费使用特征,终端标记信息,衍生变量这六大维度入手,细分成178个特征,构建号卡的活跃行为宽表,采集用户数据;
(3)进行数据清洗和预处理,根据用户宽表数据,对进行缺失值检测和异常值检查;
(4)进行数据采样,采用加入伪标签的方法,即已经被预测为涉诈用户且没有复机的号卡作为正样本加入被通报的号卡,使得正负样本的比例控制在1:15;
(5)基于机器学习算法训练模型,预测用户是电信诈骗用户的概率,同时利用交叉验证和网格搜索来寻找模型的最优参数;
(6)进行模型的迭代与优化;根据投诉用户、复机用户、接入用户优化模型,实现达到更好的预测效果。
作为优选,所述步骤(1)的通报号码分析具体为:根据公安和12321下发的通报号码核查分析,从用户的入网情况,套餐消费,历史活跃行为,上网行为,通话指标及位置信息入手分析正常用户与涉诈用户存在的区别,刻画出目标用户的特征。
作为优选,所述步骤(3)的数据清洗和预处理具体为:数据中的用户年龄,月出账信息,用户粘性采用中值填充,用户出账,省内外流量使用,语音通话次数、语音通话时长分别采用零值填充,针对异常值,用平均值来修正;针对数据中出现的数值,类型,日期等错误问题进行修正;针对缺失值,如年龄的缺失采用中位数填充,如月消费金额则进行零值的填充;在预处理中,针对一些类别变量,如用户的终端型号,用户的套餐名称,则进行独热编码的处理,将原本的中文类别转为计算机可处理的数字信息。
作为优选,所述步骤(4)数据采样时利用SMOTE算法,SMOTE算法是利用线性插值的方法计算两个新近通报号码样本,生成新的人工正样本加入到总体的正向样本中扩充正样本的数量;即运用公式:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江鸿程计算机系统有限公司,未经浙江鸿程计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210034458.3/2.html,转载请声明来源钻瓜专利网。