[发明专利]基于内存计算的集群时态数据索引方法有效

专利信息
申请号: 201810430432.4 申请日: 2018-05-08
公开(公告)号: CN108733781B 公开(公告)日: 2021-10-29
发明(设计)人: 郑啸;刘厚凯;吴宣够;秦峰 申请(专利权)人: 安徽工业大学
主分类号: G06F16/22 分类号: G06F16/22;G06F16/2458
代理公司: 南京九致知识产权代理事务所(普通合伙) 32307 代理人: 王培松
地址: 243099 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于集群内存计算下的时态数据索引方法,采用双层索引方法,先将数据进行分区,对分区建立轻量级索引,然后在其内部的Array数据集建立本发明的时态索引。在分区过程中,根据时态索引的建立过程进行了相关优化,降低了分区内部建立索引的空间消耗,分区加快了查询时对数据集的剪枝过程,提高了查询的效率,优化时态索引的建立及查询代价。本发明可在保证一定查询速度的情况下,减少索引空间的大小,优化了同类索引中存储空间过大的问题;同时减少了对时态大数据的查询的延迟,提高了整体的吞吐量。
搜索关键词: 基于 内存 计算 集群 时态 数据 索引 方法
【主权项】:
1.一种基于集群内存计算下的时态数据索引方法,其特征在于,采用双层索引方法,先将数据进行分区,对分区建立轻量级索引,然后在其内部的Array数据集建立时态索引,其具体实现包括如下索引建立和查询索引两部分:1.索引建立(1)获取集群的最大并发数,存入配置信息表中;(2)对数据进行分区,判断整个数据集下的最高区分单位,然后将同一单位的数据根据比重划分分区数量,使相邻时间数据分到相同的分区中;(3)将分区内部整个数据集分成表示事件将要开始的索引表ST,事件将要结束的索引表ED,事件已经存在的索引表ID三类;(4)建立ST、ED与ID索引表,取数据集中的最小开始时间点作为基准点basetime,把数据集中其他开始时间点与此基准点的差值作为key值,表中事件记录所在数组的下标作为value值建立索引;(5)ID表的建立,采用时间间断方法,首先获取整个数据集的时间段范围N,选取个点作为实际存储点,各点之间的距离单位,根据时间段中存在某个存储点,则在ID表中添加到相应位置即可,故该算法相比不进行数据压缩的空间极限压缩比2.索引查询:接收查询指令,先通过与分区时返回的所有最大时间点进行索引查询,对整体数据集进行剪枝操作,快速找到结果所在分区,然后进入分区内部根据本发明的时态索引方法进行二次查询,得出结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽工业大学,未经安徽工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810430432.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top