[发明专利]一种识别呼叫中心骚扰电话的方法及系统有效
申请号: | 201911195920.2 | 申请日: | 2019-11-28 |
公开(公告)号: | CN110913081B | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 周晓勇;梁淑云;刘胜;马影;陶景龙;王启凡;魏国富;徐明;殷钱安;余贤喆 | 申请(专利权)人: | 上海观安信息技术股份有限公司 |
主分类号: | H04M3/22 | 分类号: | H04M3/22;H04M3/42;H04M3/51;G06K9/62 |
代理公司: | 合肥市浩智运专利代理事务所(普通合伙) 34124 | 代理人: | 张景云 |
地址: | 200333 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 呼叫 中心 骚扰 电话 方法 系统 | ||
1.一种识别呼叫中心骚扰电话的方法,其特征在于:包括以下步骤:
先进行骚扰电话基准向量建模:
S01,获取呼叫中心全量电话在长周期内的第一通话数据基础表;所述第一通话数据基础表为信令数据中呼叫中心全量电话的主被叫数据;
S02,基于S01中第一通话数据基础表,构建通话特征,生成第一通话特征宽表;
S03,基于S02通话特征宽表,使用因子分析降维,生成通话因子挖掘表;
S04,基于S03中的通话因子挖掘表,使用聚类算法,生成电话号码的分类;
S05,根据S04中分类的类中心,选出骚扰电话所属分类,其类中心确定为骚扰电话通话因子基准向量Vbasic;
再进行骚扰电话识别:
S06,获取待识别电话在短周期内的第二通话数据基础表;所述第二通话数据基础表与第一通话数据基础表结构相同;
S07,基于S06中第二通话数据基础表,按S02中的通话特征构建方法,生成第二通话特征宽表,并使用S03中的因子得分计算模型Mfa,生成待识别电话的通话因子向量Vnbr;
S08,使用相似度算法,计算S05中骚扰电话通话因子基准向量Vbasic与S07中待识别电话的通话因子向量Vnbr之间的相似度Simnbr;
S09,根据S09中的相似度Simnbr和既设的骚扰等级区间,判定待识别电话的骚扰等级Lnbr。
2.根据权利要求1所述的一种识别呼叫中心骚扰电话的方法,其特征在于:所述步骤S01中,所述第一通话数据基础表为信令数据中呼叫中心全量电话的主被叫数据;所述第一通话数据基础表至少包括主被叫标识、是否接通、主叫号码、被叫号码、起始时间、结束时间、通话时长。
3.根据权利要求1所述的一种识别呼叫中心骚扰电话的方法,其特征在于:所述步骤S02中,所述第一通话特征宽表中表征性指标至少包括主被叫占比、接通率、不同时段内通话占比、不同通话时长段内通话占比、被叫号码回拨率、被叫号码平均呼叫次数。
4.根据权利要求1所述的一种识别呼叫中心骚扰电话的方法,其特征在于:所述步骤S03中具体包括:
S0301,对通话特征做是否适合因子分析的检验,如通过检验,则进入下一步骤S0302,如不通过检验,则返回S02重新构建通话特征;
S0302,提取公因子,使用累计方差贡献率阈值选取TOP-N个公因子;
S0303,采用最大方差法进行因子旋转,提高公因子含义的可解释性;
S0304,计算因子得分,即每个样本在TOP-N个公因子上的分值,生成通话因子挖掘表,保存为因子得分计算模型Mfa。
5.根据权利要求1所述的一种识别呼叫中心骚扰电话的方法,其特征在于:所述步骤S04中采用K-means聚类算法生成电话号码的分类。
6.根据权利要求1所述的一种识别呼叫中心骚扰电话的方法,其特征在于:所述步骤S05具体为通过业务专家人工选出骚扰电话所属分类。
7.根据权利要求1所述的一种识别呼叫中心骚扰电话的方法,其特征在于:所述步骤S06中,所述第二通话数据基础表为信令数据中待识别电话的主被叫数据;第二通话数据基础表至少包括主被叫标识、是否接通、主叫号码、被叫号码、起始时间、结束时间、通话时长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海观安信息技术股份有限公司,未经上海观安信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911195920.2/1.html,转载请声明来源钻瓜专利网。