[发明专利]不良电话号码识别方法、装置、存储介质和计算机设备在审
申请号: | 202010902589.X | 申请日: | 2020-09-01 |
公开(公告)号: | CN114205460A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 娄涛;温暖;廖珺;周莹;廖奇 | 申请(专利权)人: | 中国移动通信集团有限公司 |
主分类号: | H04M3/22 | 分类号: | H04M3/22;H04L9/40;G06F40/30;G06F40/289 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 汪源 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 不良 电话号码 识别 方法 装置 存储 介质 计算机 设备 | ||
本发明实施例提供了一种不良电话号码识别方法、装置、存储介质和计算机设备。通过对生成的媒体流信息进行解析,生成多个关键词信息和每个关键词信息对应的词性信息;根据多个关键词信息和多个词性信息进行计算,生成显著强度系数方差;判断显著强度系数方差是否位于闭合区间;若判断出显著强度系数方差位于闭合区间,将媒体信令消息对应的主叫号码设置为不良电话号码。本发明实施例中,通过对获取的媒体信令消息进行计算,生成显著强度系数方差,若判断出显著强度系数方差位于闭合区间,将媒体信令消息对应的主叫号码设置为不良电话号码,提高了识别不良电话号码的准确性。
【技术领域】
本发明涉及安全技术领域,尤其涉及一种不良电话号码识别方法、装置、存储介质和计算机设备。
【背景技术】
相关技术中,治理不良电话的途径主要为电信运营商在网络侧进行海量通话记录的采集,并结合大数据风险挖掘技术对高频、高离散度等通话进行特征分析,以识别各类不良电话号码。但近年来,各类不良电话号码为规避监管增加了大量主叫号码,通过控制主叫号码的外呼频次、外呼号码数、外呼时长等手段来实施广泛地电话骚扰,使得相关技术中的技术方案的管控效果日趋下降,降低了识别不良电话号码的准确性。
【发明内容】
有鉴于此,本发明实施例提供了一种不良电话号码识别方法、装置、存储介质和计算机设备,用以提高识别不良电话号码的准确性。
一方面,本发明实施例提供了一种不良电话号码识别方法,应用于蜜罐池中的工作蜜罐服务器,所述方法包括:
对生成的媒体流信息进行解析,生成多个关键词信息和每个所述关键词信息对应的词性信息;
根据多个所述关键词信息和多个所述词性信息进行计算,生成显著强度系数方差;
判断所述显著强度系数方差是否位于闭合区间,所述闭合区间包括第一设定阈值与第二设定阈值之间的数值范围;
若判断出所述显著强度系数方差位于所述闭合区间,将所述媒体信令消息对应的主叫号码设置为不良电话号码。
可选地,所述对获取的媒体流信息进行解析,生成多个关键词信息和每个所述关键词信息对应的词性信息之前包括:
接收所述蜜罐池中的分发单元发送的媒体信令消息,所述媒体信令消息是由终端设备发送至所述分发单元的;
提取所述媒体信令消息中主叫方向的多个媒体内容信息;
将多个所述媒体内容信息按照时间顺序排列,生成媒体流信息。
可选地,所述对所述媒体流信息进行解析,生成多个关键词信息和每个所述关键词信息对应的词性信息包括:
通过语音识别技术对所述媒体流信息进行计算,生成媒体文本信息;
通过分词技术对所述媒体文本信息进行解析,生成多个关键词信息和每个所述关键词信息对应的词性信息。
可选地,所述根据多个所述关键词信息和多个所述词性信息进行计算,生成显著强度系数方差包括:
通过文本排名算法对多个所述关键词信息进行计算,生成多个敏感词强度系数;
通过专家算法对多个所述词性信息进行计算,生成多个词性强度系数;
根据多个所述敏感词强度系数与多个所述词性强度系数,生成多个显著强度系数;
计算多个所述显著强度系数的平均值,生成平均显著强度系数;
根据多个所述显著强度系数和所述平均显著强度系数生成显著强度系数方差。
可选地,还包括:
若判断出所述显著强度系数方差不位于所述闭合区间,将所述媒体信令消息对应的主叫号码设置为良好电话号码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团有限公司,未经中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010902589.X/2.html,转载请声明来源钻瓜专利网。