[发明专利]一种基于LGB算法的诈骗电话识别方法在审

申请号：	202011185958.4	申请日：	2020-10-30
公开（公告）号：	CN112364901A	公开（公告）日：	2021-02-12
发明（设计）人：	张飞;周红敏;周荣;程钢;卜小冲;肖书华;董伟	申请（专利权）人：	上海欣方智能系统有限公司;上海欣方软件有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/08;H04M3/22
代理公司：	北京纽乐康知识产权代理事务所(普通合伙) 11210	代理人：	苏泳生
地址：	201203 上海市浦东新***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 lgb 算法诈骗电话识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于LGB算法的诈骗电话识别方法，包括以下步骤：获取原始通话的数据集；采用SMOTE算法对原始通话的数据集进行采样，并将数据集分类训练集和测试集；提取通话话单特征行为，并对模型参数进行初始化；采用十折交叉验证法训练模型，使用测试集进行验证，并计算出模型的精准率，召回率以及F1分数；采用网格搜索获得最优的LGB模型，并采用pickle模块将模型序列化；采用pickle模块将模型反序列化，并用Flask框架构建API；测通话记录到达时，调用API接口，将数据输入到LGB预测模型中，模型预测后，将结果返回。本发明提供一种基于LGB算法的诈骗电话识别方法，这种方法可以实现诈骗电话自动分类预测，还能显著提高公安人员破案效率，降低企业及个人的经济损失。

技术领域

本发明涉及网络通信技术领域，具体来说，涉及一种基于LGB算法的诈骗电话识别方法。

背景技术

骚扰电话五花八门，从最初各类中奖，现在的冒充公检法、理财、购物客服、机票改签等，实骗花样逐年翻新，并呈现有“撒网式”到“精准化”的演变趋势。电话诈骗造成了人民群众巨大经济损失，扰乱了人们正常的工作和生活秩序，极大地危害了社会的诚信，已成为严重侵害人名群众切身利益的社会公害。

发明内容

针对相关技术中的问题，本发明提出一种基于LGB算法的诈骗电话识别方法，解决现有电话诈骗造成了人民群众巨大经济损失，扰乱了人们正常的工作和生活秩序，极大地危害了社会的诚信的问题。

为了实现上述技术目的，本发明的技术方案是这样的：

设计一种基于LGB算法的诈骗电话识别方法，包括以下步骤：

步骤S1，获取原始通话的数据集，人工研判确定正负数据样本分布比例；

步骤S2，采用SMOTE算法对原始通话的数据集进行采样，形成最终数据集，并将数据集分类训练集和测试集；

步骤S3，提取通话话单特征行为，并对模型参数进行初始化；

步骤S4，采用十折交叉验证法训练模型，使用测试集进行验证，并计算出模型的精准率，召回率以及F1分数；