[发明专利]基于Bagging算法的OTT应用程序用户分类方法有效
申请号: | 201910374709.0 | 申请日: | 2019-05-07 |
公开(公告)号: | CN110175635B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 徐忠武;陈丹伟 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 牛莉莉 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 bagging 算法 ott 应用程序 用户 分类 方法 | ||
本发明公开了一种基于Bagging算法的异构多分类器OTT应用程序用户分类方法,属于机器学习技术领域。步骤如下:1.对互联网流量进行捕获,取得最初的所有IP数据包,使用网络流量生成器生成流统计特征;2.使用相应流量软件对原始IP数据包进行二次处理,执行深度包检测获得OTT应用程序,即第7层协议名称,合并流统计特征信息生成原始数据集文件;3.对原始数据集文件进行预处理后,生成用户组数据集,执行聚类分析;4.通过先前的聚类分析,使用Bagging算法构建分类模型,采用异构多分类器的方法,即基分类器使用不同的算法分类器。该方法可以通过聚类分析将用户组划分为高消费、中等消费和低消费三个集群,并通过机器学习算法良好的建立一个能够在三个识别的集群之一中对新用户进行分类的分类模型。
技术领域
本发明涉及一种应用程序用户分类方法,具体的说是一种基于Bagging算法的异构多分类器OTT应用程序用户分类方法,属于机器学习技术领域。
背景技术
1.服务降级
信息和通信技术市场正在经历极其迅速的变化。使用OTT业务模型的当前一代服务和应用公司作为其新产品的平台,已经开始对互联网服务提供商使用的传统业务模式产生重大变化。腾讯,优酷,YouTube,Netflix等公司和应用程序已经出现,以满足用户需求的通信和功能的新需求。
由于这种变化,互联网服务提供商已经发现自己处于一个困难的场景中,他们不再是市场上唯一的竞争者,而是通过OTT服务提出的方案变成了处于OTT应用和不同互联网用户的中间人。出于这个原因,他们传统的商业模式,即用户雇用访问互联网连接和通过他们的基础设施部署的不同应用程序正在被重新设计,以更灵活地与OTT服务提供商合作。这样,互联网服务提供商可以通过此类应用程序的高消费用户产生收入;另一方面,OTT服务提供商通过遵守保证其应用程序正确运行的服务级别协议来获得好处。
OTT应用程序以其正确操作的大量网络资源消耗和移动网络范围而闻名,其中移动运营商为用户提供有限消费的数据计划,服务降级是一种普遍的方式来对信息量应用进行限制,对用户在一段时间内可以传输的数据量进行限制。当用户超过他/她建立的消费限额时,电信公司为了节省资源并保证网络的正确性能,根据用户消费限制带宽。因此,考虑用户的消费行为来提出一组个性化的服务降级策略在当下显得尤为重要。
2.机器学习
近年来,机器学习的方法越来越多的使用在互联网的应用领域。在网络协议识别方面,利用决策树算法将网络流之间的相关性作为特征,相比于传统协议识别方法有着更快且更准确的优势。
尽管机器学习方法展现出了很大的优势,单一的机器学习并不能完美的解决问题。其中的统计方法认为所有事件皆由统计模型产生,这种方法忽略了参数方法中事先设定的分布模型可能与真实数据不符的风险,从而产生和预期有很大误差的结果;同时,统计模型构成的系统大多在离线状态下工作,无法满足实时监测的要求,所以要达到高准确率就需要非常高效的性能;且统计方法对于阈值的确定非常困难,阈值过高或者过低都会引起误分类或误预测率的上升。
机器学习的算法可以实现先验后验知识的无缝结合,克服框架不够直观的缺点。单一的分类算法由于噪声数据干扰、建模变量过多和抽样方法错误等问题会导致过拟合,因而不能达到很好的实验效果。且模型的精确性需要依赖一定的假设,这些假设是体现在目标系统和网络行为模式等基础上的,与假设违背将会造成准确的大幅度下降。
因此,集成学习方法是解决以上的问题的一个良好方案。Bagging方法是一种从训练集进行子抽样组成每个基模型所需要的子训练集,对所有基模型预测结果进行综合产生最终预测结果的集成学习框架。在学习器的基础上,重新从原始数据集上选取数据集进行分类预测,以多数投票方式敲定标签,同时,检验模型准确率。
发明内容
本发明所要解决的技术问题是提供一种有效的对OTT应用程序用户分类的方法,该方法基于Bagging算法的异构多分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910374709.0/2.html,转载请声明来源钻瓜专利网。