[发明专利]一种基于TemplateB+Tree的索引结构布局方法在审
申请号: | 202210798484.3 | 申请日: | 2022-07-06 |
公开(公告)号: | CN115114296A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 贾锋;袁驰;左锋;蒙国学;程坤 | 申请(专利权)人: | 中国人民解放军陆军军医大学第一附属医院 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458;G06F16/13 |
代理公司: | 重庆青飞知识产权代理有限公司 50283 | 代理人: | 彭启龙 |
地址: | 400038 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 templateb tree 索引 结构 布局 方法 | ||
1.一种基于TemplateB+Tree的索引结构布局方法,其特征在于:该方法包括以下步骤:
S1:建立基于TemplateB+Tree分布式数据处理模型,具体包括:设计基于主键和时间属性的数据域划分方法,利用数据时空特性构建二维区间,将新进数据和历史数据分配到不同组件并行处理,避免索引的新旧数据合并开销以及不必要的索引结点分裂时间开销,并充分利用模板索引信息设计存储结构和分组压缩算法,保证了索引的写入和存储效率,从而保证了高并发的数据写入能力;
S2:基于TemplateB+Tree数据的查询分解和多级索引检索,具体包括:使用数据区域划分和模型的拓扑结构设计,将用户查询请求解析为独立执行的子查询,并通过多级索引将聚合查询解析为相应的谓词函数,充分利用分布式集群的并发处理资源。
2.根据权利要求1所述的一种基于TemplateB+Tree的索引结构布局方法,其特征在于:所述的基于TemplateB+Tree构建分布式数据处理模型,具体包括以下步骤:
S11:数据元祖处理,将数据元祖组织为一个四元组;
S12:索引结构的布局及自适应更新,通过改进的TemplateB+Tree方法实现文本系统对大规模数据的高效存储。
3.根据权利要求2所述的一种基于TemplateB+Tree的索引结构布局方法,其特征在于:所述的基于TemplateB+Tree数据的查询分解和多级索引检索,具体包括以下步骤:
S21:通过R-Tree实现内存索引及DataChunk检索,实现对子查询矩形区域的快速检索,有效地获取查询请求所覆盖的区域集合;
S22:再通过系统查询解析得到不同区域的独立子查询,独立子查询根据对应的划分区域进行查询操作,提高系统的查询效率;同时结果系统的容错处理维护系统内存索引结果以及对丢失数据进行恢复,当检测查询失败时,就取消查询操作,以此减少系统的性能开销;
S23:最后通过多级索引查询,减少无效数据的访问,提高在并发检索过程中的查询效率。
4.根据权利要求3所述的一种基于TemplateB+Tree的索引结构布局方法,其特征在于:步骤S11所述数据元祖处理,具体包括以下步骤:
S111:通过数据元祖将数据组织为一个四元组d=dx,dy,dt,dz,其中dx是经度,dy是纬度,dt是时间戳,de是有效负载;
S112:将数据插入到内存索引结构前,设置空间纬度属性作为主键,将dx和dy通过开源的降维算法Z-order转换为dz,dz作为表示位置信息的主键;
S113:同时数据元祖以时间戳正常顺序递增的方式输入系统,并进行对应的数据区域划分,在用户进行数据查询时提供的查询条件包括了时间戳和多维度的键,其中时间域范围和主键键值范围形成了二维空间R=K,T,K区间即主键区间,可被定义为K(k-,k+)={k∈K|k-≤k≤k+},时间域T可被定义为T(t-,t+)={t∈T|t-≤t≤t+};通过用户给定的时间区间和主键区间就可以确定一个二维区域,以此来缩小查询范围,提高查询效率,同时也保证了查询准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军陆军军医大学第一附属医院,未经中国人民解放军陆军军医大学第一附属医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210798484.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:混凝加药方法及系统
- 下一篇:一种三维重建过程中空洞填充的方法