[发明专利]骚扰电话识别方法及其装置有效
申请号: | 201811294711.9 | 申请日: | 2018-11-01 |
公开(公告)号: | CN111131593B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 陈程;杨敬;彭继东;杨旭虹 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | H04M1/663 | 分类号: | H04M1/663 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 杨瑾瑾;陈建焕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 骚扰 电话 识别 方法 及其 装置 | ||
本发明提出一种骚扰电话识别方法及其装置,其中骚扰电话识别方法,可以包括:用户将接收到的骚扰电话号码标记为骚扰电话;提取标记的骚扰电话的特征,建立分类模型,并且使用分类模型判定待识别的主叫号码是否是骚扰电话;在用户标记与分类模型同时判定待识别的主叫号码是骚扰电话时,则主叫号码被判定为骚扰电话号码;在用户标记或者分类模型判定待识别的主叫号码为骚扰电话时,则主叫号码被判定为疑似骚扰电话号码;在用户标记和分类模型均判定待识别的主叫号码为正常电话号码时,则主叫号码被判定为正常电话号码;将骚扰电话号码、疑似骚扰电话号码、正常电话号码以及对应的号码类别存储在数据库中。
技术领域
本发明涉及通信大数据领域,尤其涉及一种骚扰电话识别方法、装置、计算机设备和计算机可读存储介质。
背景技术
“骚扰电话”是指推销产品或者是一些冒充警方、银行工作人员进行诈骗以及故意电话骚扰的行为。按骚扰目的可分为商业营销类、恶意骚扰类和违法犯罪类。识别骚扰电话在社会生活中具有广泛的应用。当前,营销电话扰民、恶意电话骚扰等问题日益突出,严重影响人民群众正常生活。更严重的,有些冒充公检法机关进行电话诈骗,造成人民的巨大财产损失。骚扰电话识别目前主要采用如下两种方案来解决:
骚扰词典方案:这种方案人工收集关键词。若任一可疑号码所在的目标通话记录包含的关键词中存在预设词典记录的骚扰特征词,则将所在的目标通话记录中存在骚扰特征词的可疑号码判定为骚扰电话号码。
规则识别方案:这种方案人工分析骚扰电话的特点,总结出一套用于识别的规则,对号码进行识别。
上述两种方案使用场景有所不同,所带来的问题和不足也有所不同:
骚扰词典方案实现起来比较简单,骚扰词典由人工制定,关键词的覆盖度不高,这样直接影响了骚扰电话的识别率,从而导致大部分骚扰电话无法被识别。规则识别方案分析了骚扰电话的特点,但识别方法由人工制定,准确率不高,可能会导致误判。
因此现有技术中迫切需要一种更加合理的方式,从而提高识别结果的准确性和覆盖率。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
根据本发明的第一个方面,提供了一种骚扰电话识别方法,可以包括:
用户将接收到的骚扰电话号码标记为骚扰电话;
提取标记的骚扰电话的特征,建立分类模型,并且使用分类模型判定待识别的主叫号码是否是骚扰电话;
在用户标记与分类模型同时判定待识别的主叫号码是骚扰电话时,则主叫号码被判定为骚扰电话号码;在用户标记或者分类模型判定待识别的主叫号码为骚扰电话时,则主叫号码被判定为疑似骚扰电话号码;在用户标记和分类模型均判定待识别的主叫号码为正常电话号码时,则主叫号码被判定为正常电话号码;
将骚扰电话号码、疑似骚扰电话号码、正常电话号码以及对应的号码类别存储在数据库中。
在本发明的一个实施例中,其中用户将接收到的骚扰电话号码标记为骚扰电话可以包括:
用户根据通话内容、通话意图、来电显示号码、或者主叫方语音语调将接收到的骚扰电话号码标记为骚扰电话。
在本发明的另一个实施例中,其中提取标记的骚扰电话的特征,建立分类模型可以包括:
提取置信度较高的标记的骚扰电话的特征,建立分类模型。
在本发明的再一个实施例中,其中标记的骚扰电话的特征包括属性特征和行为特征,属性特征包括号码类型、号码归属地、号码运营商;行为特征包括平均拨出未接响铃时间、拨出接通比、拨出拒接比例、呼入拨出比、呼入拨出时间比、平均接通时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811294711.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电热水杯和料理机
- 下一篇:一种风力发电轴承保持架制造方法及设备