[发明专利]一种利用键值匹配模型提高黑名单准确率的方法及系统有效
申请号: | 202010970431.6 | 申请日: | 2020-09-16 |
公开(公告)号: | CN111930808B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 陈晓莉;丁一帆;徐菁;徐佳丽;杨世宏;徐云华;林建洪 | 申请(专利权)人: | 浙江鹏信信息科技股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06F17/18 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 311100 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 键值 匹配 模型 提高 黑名单 准确率 方法 系统 | ||
本发明公开了一种利用键值匹配模型提高黑名单准确率的方法,包括:S1.采集类别标签中的每个号码数据对应的24小时内的通话记录;S2.根据采集到的通话记录计算每个号码的查询键,并将计算得到的查询键与号码对应的类别标签进行组合,生成号码的数据集;S3.统计所有号码的数据集,并筛选统计的数据集中同一查询键所对应的类别标签,得到查询键对应的类别标签统计模型;S4.将测试号码进行步骤S2的处理,得到测试号码的查询键,并将查询键输入至得到的统计模型中,统计模型输出与测试号码的查询键相同的查询键所对应的类别标签;S5.将输出的查询键的类别标签相加,得到输出的查询键的键值对;根据得到的键值对计算查询键所对应的类别标签,得到最终结果。
技术领域
本发明涉及通信安全以及数据挖掘技术领域,尤其涉及一种利用键值匹配模型提高黑名单准确率的方法及系统。
背景技术
随着通信行业的成熟和发展,移动通信资费逐渐降低,群众和企业从中切实受益,但低成本的通信费用也为恶意营销类骚扰电话提供了滋生的土壤。一些不法分子出于恶意报复、勒索等目的,利用移动通信进行骚扰等违法犯罪活动。另外市场形成饱和格局,企业之间为实现产品销售的竞争激化,也使得未经过用户允许的营销类骚扰电话的传播。AI发展衍生出了电销机器人,减低了营销成本,更加剧了这一产业的发展。商业营销类电话、恶意骚扰等电话泛滥,给移动用户带来了巨大的经济损失和生活困扰,同时蚕食着电信营运商的宝贵网络资源。
随着云计算、大数据的不断发展,海量数据计算能力不断增强,核心算法不断突破,应用邻域不断扩展,已成为技术创新的重要技术,在骚扰电话治理工作中发挥的作用也越发明显,识别准确度更高、覆盖完整性更全、监控实时性更快,在骚扰电话治理工作中已经成为重要生产力,高效识别骚扰电话可有效减少骚扰电话蔓延带来的负面影响。
如公开号为CN109995924A的专利公开了一种欺诈电话识别方法、装置、设备及介质,包括如下步骤:获取用户的基础通话数据;将所述基础通话数据进行统计及计算,生成与用户通话的各电话号码及其数据特征;从所述与用户通话的各电话号码中选出多个已知的黑名单号码及多个已知的非黑名单号码;建立二分类训练模型,将所述多个已知的黑名单号码的数据特征与所述多个已知的非黑名单号码的数据特征输入所述二分类训练模型内,训练所述二分类训练模型,以得到经过训练的二分类训练模型;及将新号码的数据特征输入所述经过训练的二分类训练模型内,以识别该新号码是否是欺诈电话。虽然上述专利可以识别欺诈电话,但是其只是根据数据特征对诈骗号码进行一次识别,依然存在误判现象以及识别准确率不高的问题。
发明内容
本发明的目的是针对现有技术的缺陷,提供了一种利用键值匹配模型提高黑名单准确率的方法及系统,通过查询键的匹配和计算类别的概率,输出号码对应的最大可能的类标,从而能够在不降低覆盖率的同时,通过二次筛选机制(键值匹配)提高黑名单识别准确率。
为了实现以上目的,本发明采用以下技术方案:
一种利用键值匹配模型提高黑名单准确率的方法,包括步骤:
S1.采集类别标签中的每个号码数据对应的24小时内的通话记录;
S2.根据采集到的通话记录计算每个号码的查询键,并将计算得到的查询键与号码对应的类别标签进行组合,生成号码的数据集;
S3.统计所有号码的数据集,并筛选统计的数据集中同一查询键所对应的类别标签,得到查询键对应的类别标签统计模型;
S4.将测试号码进行步骤S2的处理,得到测试号码的查询键,并将所述查询键输入至得到的统计模型中,统计模型输出与测试号码的查询键相同的查询键所对应的类别标签;
S5.将输出的查询键的类别标签相加,得到输出的查询键的键值对;根据得到的键值对计算查询键所对应的类别标签,得到最终结果。
进一步的,所述步骤S1中的类别标签的号码包括黑名单号码、白名单号码、未定义号码、正常号码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江鹏信信息科技股份有限公司,未经浙江鹏信信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010970431.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:施工现场的人机碰撞预警方法及系统
- 下一篇:复合式能量收集装置