[发明专利]一种基于概率测量数据结构Sketch的网络流量测量方法和系统有效
申请号: | 201910869952.X | 申请日: | 2019-09-16 |
公开(公告)号: | CN110830322B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 杨仝;李雨欣 | 申请(专利权)人: | 北京大学 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;G06F17/12 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 概率 测量 数据结构 sketch 网络流量 测量方法 系统 | ||
1.一种基于近似零误差的概率测量数据结构Sketch的网络流量测量方法,其特征在于,包括以下步骤:
设立用于存储小流信息的CM-Sketch数据结构和用于存储标号的数据结构;所述CM-Sketch包含d个数组,用Ai表示其中的第i个数组,每个数组含有w个桶,每个桶中都有一个计数器,用Ai[j]表示CM-Sketch中第i个数组的第j个桶,每个数组Ai都与一个均匀分布独立的哈希函数hi(.)相关联;所述存储标号的数据结构包含k个一维数组,用Bi表示其中的第i个数组,每个数组都对应于一个数值,用fi表示第i个数组Bi所对应的数值;
在网络流量测量过程中更新表项时,首先更新CM-Sketch,然后基于对CM-Sketch的观察来对存储标号的数据结构进行更新。
2.如权利要求1所述的方法,其特征在于,包含插入操作,所述插入操作的步骤如下:
在插入一个流的标号f时,首先对已经更新过的CM-Sketch进行一次查询,计算d个哈希函数h1(f),h2(f),...,hd(f)并且返回A1[h1(f)%w],A2[h2(f)%w],...,Ad[hd(f)%w]中最小的计数器值作为查询的结果;
将查询结果与所述存储标号的数据结构中k个数组对应的数值进行匹配,若存在fi与匹配,则将标号f插入到数组Bi的尾部;若不存在,则放弃本次插入操作。
3.如权利要求1或2所述的方法,其特征在于,若请求精确复原某一流量信息,则由多个一维数组中存储的流量标号,以及CM Sketch中记录的信息,导出方程组并进行求解,返回计算得到的信息。
4.如权利要求1所述的方法,其特征在于,额外设立一个计数器,用于辅助流标号的插入操作,并对存储标号的数据结构进行删减,仅用一个数组B存储即可;所述计数器由一个一维数组组成,该数组中含有255个桶,每个桶含有一个计数器,用C表示该数组,用C[i]表示其中第i个桶的计数器。
5.如权利要求4所述的方法,其特征在于,包含插入操作,所述插入操作的步骤如下:
在插入一个流的标号f时,首先对已经更新过的CM-Sketch进行一次查询,计算d个哈希函数h1(f),h2(f),...,hd(f)并且返回A1[h1(f)%w],A2[h2(f)%w],...,Ad[hd(f)%w]中最小的计数器值作为查询的结果;
然后对数组C中的第个桶进行更新,也即对加1;更新完成后,对该计数器的值进行观察,若满足则将流标号f插入到数组B的尾部;其中t为一参数,用于调整漏失率。
6.根据权利要求5所述的方法,其特征在于,t的取值为0.5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910869952.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种隐私风险评估方法
- 下一篇:一种自主摄影系统和方法