[发明专利]骚扰电话号码确定方法、装置和系统有效
申请号: | 201510408711.7 | 申请日: | 2015-07-13 |
公开(公告)号: | CN105100366B | 公开(公告)日: | 2018-03-20 |
发明(设计)人: | 秦秋平;陈志军;龙飞 | 申请(专利权)人: | 小米科技有限责任公司 |
主分类号: | H04M1/663 | 分类号: | H04M1/663 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 滕一斌 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 骚扰 电话号码 确定 方法 装置 系统 | ||
技术领域
本公开涉及安全技术领域,特别涉及一种骚扰电话号码确定方法、装置和系统。
背景技术
骚扰电话号码通常可以包括推销保险的电话号码、房产中介的电话号码和进行诈骗的电话号码,这些骚扰电话号码长期干扰着人们的正常生活。
相关技术中有一种骚扰电话号码确定方法,该方法首先由大量用户通过终端来确认接听到的号码是否为骚扰电话号码,并将确认的骚扰电话号码上传至服务器,服务器将大量用户确认的骚扰电话号码进行汇总生成骚扰电话号码表。
公开内容
为了解决相关技术问题,本公开实施例提供了一种骚扰电话号码确定方法、装置和系统。所述技术方案如下:
第一方面,提供一种骚扰电话号码确定方法,该方法包括:
从至少一个终端获取目标通话记录得到通话记录集合,通话记录集合中包含有预定个数的目标通话记录,每个目标通话记录中包含有陌生号码和至少一个关键词,至少一个关键词是终端根据与陌生号码通话的通话内容文本数据得到的,用于表征通话内容文本数据的通话主题,陌生号码为陌生号码对应的终端的通讯录中未存储的号码;
获取通话记录集合中N个可疑号码,N个可疑号码为预定个数的目标通话记录中包含的陌生号码按出现次数降序排列,排名前N位的陌生号码;
检测每个可疑号码所在的目标通话记录包含的关键词中是否存在预设词典记录的骚扰特征词;
若任一可疑号码所在的目标通话记录包含的关键词中存在预设词典记录的骚扰特征词,将所在的目标通话记录中存在骚扰特征词的可疑号码确定为骚扰电话号码。
本公开的第一方面,能够方便快捷的确定出通话记录集合包含的大量电话号码中的骚扰电话号码,提高了骚扰电话号码的获取效率。
结合第一方面,在第一种可实现方式中,将所在的目标通话记录中存在骚扰特征词的可疑号码确定为骚扰电话号码,包括:
获取包含第一可疑电话号码的目标通话记录组成的目标通话记录集合,第一可疑电话号码为任一所在的目标通话记录中存在骚扰特征词的可疑号码;
根据预设的骚扰特征词与骚扰类型的对应关系,确定第一通话记录包含的骚扰特征词的骚扰类型,骚扰类型表征第一可疑电话号码的骚扰目的,第一通话记录为目标通话记录集合中的任一通话记录;
将第一通话记录包含的骚扰特征词的骚扰类型确定为第一通话记录的骚扰类型;
统计目标通话记录集合中每种骚扰类型对应的通话记录的数量;
根据每种骚扰类型对应的通话记录的数量与目标通话记录集合中通话记录的总数的比值,确定每种骚扰类型在目标通话记录集合中的比例;
若目标通话记录集合中存在比例大于比例阈值的骚扰类型,则确定第一可疑电话号码为骚扰电话号码。
本公开第一方面的第一种可实现方式,提高了确定的骚扰电话号码的准确性。
结合第一种可实现方式,在第二种可实现方式中,该方法还包括:
将目标通话记录集合中比例最大的骚扰类型作为骚扰电话号码的骚扰类型。
本公开第一方面的第二种可实现方式,确定了骚扰电话号码的骚扰类型。
结合第一方面,或第一种可实现方式,或第二种可实现方式,在第三种可实现方式中,每个目标通话记录中包含有两个电话号码,两个电话号码中包含有陌生号码,获取通话记录集合中N个可疑号码,包括:
对通话记录集合进行去重复处理,去重复处理用于丢弃至少两个同类通话记录中除包含关键词最多的目标通话记录之外的通话记录,同类通话记录为包含相同的两个电话号码的目标通话记录;
获取处理后的通话记录集合中N个可疑号码。
本公开第一方面的第三种可实现方式,增加了最终确定的骚扰电话号码的准确性。
第二方面,提供一种骚扰电话号码确定方法,该方法包括:
获取与陌生号码通话的通话语音数据和通话记录,通话记录中包含有陌生号码,陌生号码为通讯录中未存储的号码;
将通话语音数据转化为通话内容文本数据;
获取通话内容文本数据的至少一个关键词,至少一个关键词为表征通话内容文本数据的通话主题的词;
根据至少一个关键词和通话记录生成目标通话记录,目标通话记录中包含有陌生号码和至少一个关键词;
将目标通话记录提供给服务器,服务器用于根据目标通话记录中的陌生号码和至少一个关键词确定陌生号码是否为骚扰电话号码。
本公开的第二方面,使服务器能够方便快捷的确定出通话记录集合包含的大量电话号码中的骚扰电话号码,提高了骚扰电话号码的获取效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510408711.7/2.html,转载请声明来源钻瓜专利网。