[发明专利]一种基于流数约减的自适应公平抽样方法在审
申请号: | 201710046224.X | 申请日: | 2017-01-22 |
公开(公告)号: | CN106789444A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 卜佑军;刘洪;张震;韩伟涛;伊鹏;陈鸿昶;李向涛;马海龙;白冰 | 申请(专利权)人: | 中国人民解放军信息工程大学 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L12/24 |
代理公司: | 郑州大通专利商标代理有限公司41111 | 代理人: | 李伟 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 流数约减 自适应 公平 抽样 方法 | ||
技术领域
本发明属于网络流量测量领域,具体的涉及一种基于流数约减的自适应公平抽样保证方法。
背景技术
网络流量测量将流的各项指标量化,直观地描述当前网络流量的组成成分,反映网络当前的运行状态,在流量计费,流量识别,故障检测和网络安全等应用中起着极其重要的作用。由于网络上数据的增长速度远远超过存储器性能的增长速度,因此对每个流进行实时统计成为高速骨干网实时流量测量的巨大难题,通过抽样对数据进行压缩是实时测量高速网络的重要手段。然而现有的抽样算法以牺牲大流的准确性为代价来提高小流的准确性,从而导致算法的公平性不强。虽然通过对每个流进行统计可以提高算法的公平性,但是从存储开销的角度来看,并不能实现可扩展的流量测量。
由于小流统计准确性低往往严重影响到网络安全和异常检测的正常进行,网络流量测量希望进一步提高小流的准确性以满足公平性要求,并且解决算法的可扩展性问题。目前网络流量测量虽然实现了一定程度的公平抽样,但是缺乏对算法扩展性和公平性的综合考虑。如何实现算法的公平性和扩展性,是网络流量测量面临的重要挑战。
发明内容
本发明针对现有的抽样算法以牺牲大流的准确性为代价来提高小流的准确性,从而导致算法的公平性不强,不能很好的解决算法的可扩展性等问题,提出一种基于流数约减的自适应公平抽样保证方法。
本发明的技术方案是:一种基于流数约减的自适应公平抽样方法,包括以下步骤:
步骤1:根据到达分组是否属于已有流表项,得到不同的网络流公平性抽样策略;
步骤2:利用流数约减对该分组所属流进行大小流区分计数,得到选择性抽取比例,并建立存储器缓存中的新流表项;
步骤3:根据后续流到达测量点的速度进行自适应抽取,得到流个数整体压缩的所有样本流集合;
步骤4:根据所有样本流集合的流量大小分布特征,提出一个新的抽样概率函数簇;
步骤5:根据概率函数簇对样本流集合进行公平抽样,得到样本中大小流的公平性抽样结果。
所述的基于流数约减的自适应公平抽样方法,所述步骤1中网络流公平性抽样策略包括:
步骤201:根据到达测量点的分组数据包,查询缓存中所属流表项是否存在;
步骤202:根据该分组所属流缓存存在与否,判断是否采用流数约减策略,得到所有样本流集合;
步骤203:根据得到的所有样本流集合,进行样本集合的网络流公平抽样。所述的基于流数约减的自适应公平抽样方法,所述步骤2的具体包括:
步骤301:根据流数约减策略对分组所属流采用计数型布鲁姆过滤器进行大小流区分计数;
步骤302:根据不同大小流的计数值,以概率Pf进行选择性抽取分组;
步骤303:根据选中的流分组数目,建立存储器新的缓存流表项。
所述的基于流数约减的自适应公平抽样方法,所述步骤3具体包括:
步骤401:根据新流表项到达测量点的速度,得到被抽取建立表项的新到达分组的数目;
步骤402:根据已建立流表项的分组数目,自适应改变流个数的压缩集合;
步骤403:根据得到的流数整体约减的分组集合,得到需要统计的所有样本流集合。
所述的基于流数约减的自适应公平抽样方法,所述步骤4获得抽样概率函数簇具体包括:
步骤501:根据样本流中流大小的重尾分布特征,结合两个类幂指数抽样概率函数,寻求一个流大小是减函数的抽样概率函数;
步骤502:根据流大小估计值的相对误差不超过参数值ε,使得小流的抽样概率准确性提高;
步骤503:根据不同的抽样函数特性,提出一个新的抽样概率函数簇。
所述的基于流数约减的自适应公平抽样方法,所述步骤5样本中大小流的公平性抽样结果操作包括:
步骤601:根据当前分组所属流的大小决定抽样概率P;
步骤602:根据抽样概率函数簇决定包所对应计数器为i的流的抽样概率Pi;
步骤603:根据不同流大小的抽样概率,得到所有流相对误差基本一致的公平性抽样结果。
本发明的有益效果是:本发明与现有技术相比,具有以下优点:具有可扩展性和公平性,本发明提供的公平抽样方法通过流数约减方法对流进行等比例抽取,实现了测量的可扩展性;同时利用新的概率抽样函数簇对样本流集合进行公平抽样,提高了算法的公平性;算法不需要提取每个流的统计特征,能够有效地降低算法的机算复杂度,提高小流的统计准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军信息工程大学,未经中国人民解放军信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710046224.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:在光学存储带中的分布式逻辑轨道布局
- 下一篇:电压电平移位自时控写入协助