[发明专利]骚扰电话识别方法、装置及存储介质在审
申请号: | 201811613610.3 | 申请日: | 2018-12-27 |
公开(公告)号: | CN109688275A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 赵越;王瑜;葛阳 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | H04M3/22 | 分类号: | H04M3/22;H04M3/436;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 吴会英;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 骚扰电话 训练子集 存储介质 分类结果 特征参数 正常电话 模糊聚类算法 训练数据集 准确度 抽样算法 呼叫请求 随机森林 训练数据 训练样本 主叫号码 权重 算法 分类 | ||
1.一种骚扰电话识别方法,其特征在于,包括:
获取训练数据集,所述训练数据集包括多个训练样本,所述训练样本携带分类标签;
根据模糊聚类算法,对所述训练数据集中的所有训练样本进行分类,获取分类结果,所述分类结果包括第一骚扰电话集、第二骚扰电话集和正常电话集,所述第一骚扰电话集中的训练样本均为第一类型骚扰电话,所述第二骚扰电话集中的训练样本均为第二类型骚扰电话;
根据基于权重的欠抽样算法、第一骚扰电话集、第二骚扰电话集以及正常电话集,获取所述第一骚扰电话集对应的多个第一训练子集、第二骚扰电话集合对应的多个第二训练子集;
根据所述多个第一训练子集、所述多个第二训练子集、所述第一类型骚扰电话的特征参数、所述第二类型骚扰电话的特征参数以及随机森林算法,获取骚扰电话识别模型,其中,所述骚扰电话识别模型包括第一骚扰电话识别模型和第二骚扰电话识别模型;
根据呼叫请求中的主叫号码的特征参数、所述骚扰电话识别模型,获取识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个第一训练子集、所述多个第二训练子集、所述第一类型骚扰电话的特征参数、所述第二类型骚扰电话的特征参数以及随机森林算法,获取骚扰电话识别模型之后,还包括:
根据验证数据集,获取所述骚扰电话识别模型的准确率和召回率,其中,所述验证数据集包括多个验证样本,所述验证样本携带分类标签;
根据所述准确率和所述召回率,获取所述骚扰电话识别模型的验证评分值;
根据所述验证评分值以及预设标准阈值,判断所述骚扰电话识别模型是否满足预设精度要求。
3.根据权利要求2所述的方法,其特征在于,所述根据所述准确率和所述召回率,获取所述骚扰电话识别模型的验证评分值,包括:
通过以下公式,获取所述骚扰电话识别模型的验证评分值:
其中,F1表示所述骚扰电话识别模型的验证评分值,precision表示所述骚扰电话识别模型的准确率,recall表示所述骚扰电话识别模型的召回率。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若所述骚扰电话识别模型不满足预设精度要求,对所述骚扰电话识别模型进行优化,直至满足预设精度要求为止。
5.根据权利要求1所述的方法,其特征在于,所述根据呼叫请求中的主叫号码的特征参数、所述骚扰电话识别模型,获取识别结果之后,还包括:
将所述识别结果发送至运营商,以使运营商在网络通信侧对主叫号码对应的呼叫请求进行实时拦截。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述第一类型骚扰电话的特征参数包括以下一项或多项:
通话次数、通话时长、试呼次数、试呼次数/被叫个数、主叫所用基站个数;
所述第二类型骚扰电话的特征参数包括以下一项或多项:
通话时长、试呼次数、被叫个数/被叫号段个数、以及被叫挂断次数/接通电话次数。
7.一种骚扰电话识别装置,其特征在于,包括:
第一获取模块,用于获取训练数据集,所述训练数据集包括多个训练样本,所述训练样本携带分类标签;
聚类模块,用于根据模糊聚类算法,对所述训练数据集中的所有训练样本进行分类,获取分类结果,所述分类结果包括第一骚扰电话集、第二骚扰电话集和正常电话集,所述第一骚扰电话集中的训练样本均为第一类型骚扰电话,所述第二骚扰电话集中的训练样本均为第二类型骚扰电话;
第二获取模块,用于根据基于权重的欠抽样算法、第一骚扰电话集、第二骚扰电话集以及正常电话集,获取所述第一骚扰电话集对应的多个第一训练子集、第二骚扰电话集合对应的多个第二训练子集;
训练模块,用于根据所述多个第一训练子集、所述多个第二训练子集、所述第一类型骚扰电话的特征参数、所述第二类型骚扰电话的特征参数以及随机森林算法,获取骚扰电话识别模型,其中,所述骚扰电话识别模型包括第一骚扰电话识别模型和第二骚扰电话识别模型;
识别模块,用于根据呼叫请求中的主叫号码的特征参数、所述骚扰电话识别模型,获取识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811613610.3/1.html,转载请声明来源钻瓜专利网。