[发明专利]一种估算滑动窗口下的数据流平均值的方法与系统在审
申请号: | 201410315983.8 | 申请日: | 2014-07-02 |
公开(公告)号: | CN104090952A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 王非;陈岁迪 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 武汉东喻专利代理事务所(普通合伙) 42224 | 代理人: | 方放 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种估算滑动窗口下数据流平均值的方法,包括以下步骤:1初始化指数直方图,所述指数直方图把滑动窗口下的数据元素划分到不同的层次的若干个桶中,所述桶用来存储数据流中一段时间内的数据集合信息,所述信息包括数据集合中距离当前时刻最近的数据元素的时间戳和数据集合元素之和;2将数据流的信息储存在桶中,所述桶在指数直方图中的位置由时间戳决定。当有新的数据添加以及旧的数据删除时,以桶的容量为准则进行桶的合并与分解;3查询所述指数直方图,输出近似平均值。本发明还提供了相应的估算滑动窗口下数据流平均值的系统。本发明不需要保存全部历史数据,计算滑动窗口中的平均值时,不需要扫描历史数据,且误差可控。 | ||
搜索关键词: | 一种 估算 滑动 窗口 数据流 平均值 方法 系统 | ||
【主权项】:
一种估算滑动窗口下数据流平均值的方法,其特征在于,包括以下步骤:(1)、初始化指数直方图:所述指数直方图把数据元素划分到不同的层次上,每层由若干个桶组成,所述桶用来存储数据流中一段时间内的数据集合信息,所述信息包括数据集合对应的时间戳和容量,所述时间戳表示的是数据集合中距离当前时刻最近的数据的时间戳,容量表示的是数据集合中所有数据元素的和;(2)、将数据流的信息储存在桶中:所述桶在指数直方图中的位置由时间戳决定:层数越高,所述层上的桶的时间戳越旧,层数越低,所述层上的桶的时间戳越新;所述桶的时间戳越旧,表示桶中数据元素离当前时刻越远;桶的时间戳越新,表示桶中数据元素离当前时刻越近;同一层中的桶按时间戳新旧顺序排列;随着数据的不断流入,当有新的数据添加以及旧的数据删除时,进行桶的合并与分解操作,合并分解规则以桶的容量为参考;(3)、查询指数直方图,输出近似平均值:首先计算指数直方图中所有桶的容量之和SUM,如果指数直方图只有一层,则输出近似平均值
计算公式为
其中N是滑动窗口的大小;如果指数直方图不只一层,则查询时间戳最旧的桶的容量C,输出近似平均值
其计算公式为
其中N是滑动窗口的大小。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410315983.8/,转载请声明来源钻瓜专利网。
- 上一篇:查询信息推荐方法和装置
- 下一篇:一种基于云计算的数据库访问方法及系统