[发明专利]一种基于流式数据的局部性非聚簇索引方法及系统有效
申请号: | 201510641703.7 | 申请日: | 2015-09-30 |
公开(公告)号: | CN105335475B | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 郑天祺;程学旗;张敬亮;黄淳 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;田景宜 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流式数据 哈希索引 实时更新 索引记录 索引表 索引 局部性 索引键 聚簇 写入 触发条件 存储介质 带宽开销 继续执行 局部特性 顺序扫描 随机访问 索引数据 有效地 构建 主键 查询 覆盖 访问 | ||
1.一种基于流式数据的局部性非聚簇索引方法,其特征在于,包括:
实时更新步骤,实时更新哈希索引表中针对所接收到的每条流式数据而产生的索引记录,该索引记录记载了该流式数据中出现的索引键、该索引键首次出现时所对应的主键以及从首次出现到当前最末次出现所覆盖的数据个数;
写入步骤,当达到触发条件时,将该哈希索引表中的该索引记录写入索引表中,继续执行该实时更新步骤。
2.如权利要求1所述的方法,其特征在于,该方法还包括一查询步骤,在该哈希索引表以及该索引表中分别找到索引键为待查询的索引值的全部索引记录,根据所找到的索引记录中所记载的主键,在流式数据的数据表中确认查询起点,根据索引记录中所记载的数据个数,确定查询终点,从该查询起点到查询终点所覆盖的数据中,过滤掉索引键与该索引值不符的数据。
3.如权利要求2所述的方法,其特征在于,该触发条件包括预设的触发计数以及预设的触发时长;
如果该哈希索引表中任一索引键所对应的该数据个数达到该触发计数,将该哈希索引表中该索引键所对应的索引记录写入该索引表中;
在达到该触发时长时,执行该写入步骤,将该哈希索引表中所有索引记录写入该索引表中。
4.如权利要求3所述的方法,其特征在于,该写入步骤后还包括维护索引一致性步骤,每次以达到该预设的触发时长而触发该写入步骤时,存储当前最后一条数据的主键,当发生系统重启时,从该主键所对应的数据开始,重新执行该实时更新步骤。
5.如权利要求4所述的方法,其特征在于,在该维护索引一致性步骤之后执行该查询步骤时,还包括:过滤主键相同的索引记录。
6.如权利要求1所述的方法,其特征在于,可以分别利用不同的哈希索引表执行该实时更新步骤,但任一时刻仅一个哈希索引表可以执行该实时更新步骤。
7.如权利要求6所述的方法,其特征在于,当达到触发条件时,将该哈希索引表中的索引记录送入一索引写队列,以排队等待写入该索引表。
8.如权利要求1所述的方法,其特征在于,还包括:当需要对索引表中的索引记录进行更新,将原始索引键修改为目标索引键时,在索引表中利用该目标索引键进行查询,得到目标扫描窗口,判断该原始索引键所对应的主键是否被覆盖于该目标扫描窗口,如果是,直接将所述索引记录中的原始索引键修改为目标索引键,如果否,在索引表中增加一条索引记录,索引键为该目标索引键,主键为该原始索引键所对应的主键,数据个数为1。
9.一种基于流式数据的局部性非聚簇索引系统,其特征在于,包括:
实时更新单元,用于实时更新哈希索引表中针对所接收到的每条流式数据而产生的索引记录,该索引记录记载了该流式数据中出现的索引键、该索引键首次出现时所对应的主键以及从首次出现到当前最末次出现所覆盖的数据个数;
写入单元,用于当达到触发条件时,将该哈希索引表中的该索引记录写入索引表中,继续执行该实时更新步骤。
10.如权利要求9所述的系统,其特征在于,该系统还包括一查询单元,用于在该哈希索引表以及该索引表中分别找到索引键为待查询的索引值的全部索引记录,根据所找到的索引记录中所记载的主键,在流式数据的数据表中确认查询起点,根据索引记录中所记载的数据个数,确定查询终点,从该查询起点到查询终点所覆盖的数据中,过滤掉索引键与该索引值不符的数据。
11.如权利要求10所述的系统,其特征在于,该触发条件包括预设的触发计数以及预设的触发时长;
如果该哈希索引表中任一索引键所对应的该数据个数达到该触发计数,该写入单元将该哈希索引表中该索引键所对应的索引记录写入该索引表中;
在达到该触发时长时,该写入单元将该哈希索引表中所有索引记录写入该索引表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510641703.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:网页的访问方法及装置
- 下一篇:基于分布式环境的数据存储及处理系统