[发明专利]一种基于SVM分类算法的话单信息中敏感电话发现方法在审
申请号: | 201711368252.X | 申请日: | 2017-12-18 |
公开(公告)号: | CN108108756A | 公开(公告)日: | 2018-06-01 |
发明(设计)人: | 曹万鹏;罗云彬;李鹏;李浩;徐青;史辉;林绍福 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大数据 特征信息 敏感 电信运营商 可疑电话 敏感特征 特征向量 通话记录 单数据 发现 挖掘 对话 分析 | ||
本发明公开一种基于SVM分类算法的话单信息中敏感电话发现方法,包括以下步骤:步骤1、在话单大数据中寻找出用户话单中与一般、普通电话具有根本性差异的具有一系列敏感特征的电话号码;步骤2、对电信运营商话单大数据进行挖掘、分析,在用户话单大数据中提取不同号码的通话记录特征信息;步骤3、把上述特征信息做为训练SVM分类模型的特征向量,在话单大数据中选取一定量已知的话单数据,训练SVM分类模型;步骤4、采用改SVM分类算法模型,对话单中可能的敏感电话号码与正常号码进行区分,寻找出可疑电话。
技术领域
本发明属于模式识别方法,特别是涉及一种基于SVM分类算法的话单信息中敏感电话发现方法。
背景技术
随着人工智能的越来越成熟,其在生产生活中得到了更多实际应用。机器学习技术作为人工智能技术中最为核心算法进一步吸引了人们的目光,成为模式识别和分类算法中的研究热点。其中,统计学习理论自从提出以来就得到了广泛的应用,基于SVM的分类算法因为其结构简单、泛化能力强、学习和预测时间短、能实现全局最优等卓越性能而得到广泛关注和良好发展。特别是,SVM分类算法在解决小样本,非线性和高维模式识别上具有很大优势,被广泛应用于人脸识别,笔迹鉴定和其他相关领域。SVM算法通过满足Mercer条件的核函数,把原始空间上样本的非线性问题变换为高维空间的线性问题,实现了非线性问题的线性化,也直接关系到SVM分类算法的性能。
分类器模型训练中,为对分类有利的样本分配较大的权值是一种常用的手段,有利于训练获得的分类器模型后续的分类。基于SVM分类模型原理中,分类间隔大意味着能以充分大的确信度对训练数据进行分类。也就是说,不仅能将正负样本点分开,而且对最难分的样本点也有足够大的确信度将他们分开。这样具有较大间隔的超平面对未知的样本也将有很好的分类预测能力。
基于以上考虑,本专利提出一种基于SVM分类算法的话单信息中敏感电话发现方法。基于话单数据中不同通话记录的特征信息,从敏感电话通话与其他普通通话之间的根本差异出发,挖掘并计算相关特征量,基于SVM分类算法,对话单大数据中的敏感电话号码与正常电话号码进行区分,使得最终基于SVM分类算法设计的分类器分类效果更佳、误判率更低。
发明内容
针对传统的敏感电话分辨不准确的不足,提出一种基于SVM分类算法的话单信息的敏感电话发现方法,通过挖掘通话话单大数据中敏感电话与其他普通通话每条话单之间的根本差异作为特征向量,基于SVM分类算法,对话单大数据中的敏感电话号码与正常电话号码进行区分,进而使得到的SVM分类器模型分类效果更佳、分类精度更高。
其中,涉及到对话单大数据中关键区别特征信息的挖掘、计算、分析,它们决定了最终是否可以准确、高效的对上述话单数据信息中不同号码的区分。
与现有技术相比,本发明具有以下明显的优势和有益效果:
(1)本发明基于敏感电话在用户话单中相关特征信息的特有性,及其与一般电话的根本性差异,采用SVM分类算法模型,提出一种基于SVM分类算法的话单信息的敏感电话发现方法。
(2)通过对推销、广告、骚扰电话在话单大数据中呈现的规律性进行分析、挖掘,基于SVM分类算法,对话单大数据中的敏感电话号码与一般、正常号码进行区分,使得最终基于SVM算法的分类器分类效果更佳、误判率更低。
附图说明
图1为本发明所提出的一种基于SVM分类算法的话单信息中敏感电话发现方法功能框图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步的描述。
本发明所涉及方法的流程图如图1所示,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711368252.X/2.html,转载请声明来源钻瓜专利网。