[发明专利]一种面向分位数查询的概要数据动态分裂与维护方法有效
申请号: | 201510304691.9 | 申请日: | 2015-06-04 |
公开(公告)号: | CN105045806B | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 王树鹏;张燕琴;吴广君 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余功勋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种面向分位数查询的概要数据动态分裂与维护方法。该方法首先对写入的数据项进行采样,构建q‑digit概要数据;然后按照q‑digit后序遍历的分位数查询规则,查询q‑digit概要数据中数据项的中间点;然后以中间点为基础逆序遍历q‑digit概要数据,建立分割路径,根据分割路径把q‑digit概要数据分裂成两个数据量近似均等的概要数据结构;分裂以后每个结构仍然是独立的q‑digit结构,可以正常接收并处理新到达的数据源。本发明可用于分布式环境下q‑digit概要数据的动态管理,有效支持大数据环境下概要数据的维护与管理,有效支持分位数查询与计算。 | ||
搜索关键词: | 一种 面向 位数 查询 概要 数据 动态 分裂 维护 方法 | ||
【主权项】:
1.一种分布式环境下面向分位数查询的概要数据动态维护方法,其特征在于,在负载出现不均衡时,或者需要增加新处理设备时,采用以下步骤对概要数据进行分裂操作,将一部分数据分摊到其他处理节点上,分裂以后的概要数据独立的支持分裂以后的数据区间内的数据查询:1)对写入的数据项进行采样,构建q‑digit概要数据;2)按照q‑digit后序遍历的分位数查询规则,查询q‑digit概要数据中数据项的中间点;3)以中间点为基础逆序遍历q‑digit概要数据,建立分割路径,根据分割路径把q‑digit概要数据分裂成两个数据量近似均等的概要数据结构;所述q‑digit概要数据的数据组织结构为树形结构,所述树形结构的节点分为根节点、叶节点和内节点,其中内节点满足以下两个条件:(1)(2)其中count(v)表示节点v的值,表示向下取整,vp是v的父节点,vs是v的兄弟节点,n是所有数据项的第一范数,k是设定的压缩参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510304691.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据采集方法及装置
- 下一篇:模型集群的输入参数获取方法及系统