[发明专利]数据索引方法和装置有效
申请号: | 201210039265.3 | 申请日: | 2012-02-20 |
公开(公告)号: | CN102646118A | 公开(公告)日: | 2012-08-22 |
发明(设计)人: | 王恩东;文中领;刘正伟 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 栗若木;曲鹏 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 索引 方法 装置 | ||
技术领域
本发明涉及数据管理领域,尤其涉及一种数据索引方法和装置。
背景技术
近几十年来,数据管理技术发展迅猛,在国民经济建设中起到了突出作用。以Oracle、DB2、SQL Server等为代表的大型关系数据库管理系统(Relational Database Management System,RDBMS)更是诸多大型信息管理系统、客户关系管理软件不可或缺的核心部分。同时,以可扩展标记语言(Extensible Markup Language,XML)为代表的半结构化数据管理技术也在数据交换和缺乏严格结构的数据管理方面占据一席之地。上述技术均对数据质量、待处理数据的准确性要求非常高。当原始数据的质量不高时,需要先经过预处理过程提升数据质量。以部门人事管理系统为例,员工的个人资料、薪酬待遇和日常考核等信息必须准确。但在诸如经济、军事和电信等领域,数据的不确定性普遍存在,其存在性未知而且各属性值存在误差。尽管数据预处理能够提升原始数据集合的质量,但也可能会丧失原始数据集合的部分性质,导致无法返回高质量的查询结果。典型的应用背景如下。
基于位置的服务(Location Base Service,LBS)是移动计算领域的核心问题。位置服务跟踪移动物体(或者用户),然后将物体(或用户)的位置在电子地图上定位,以此为基础提供空间信息服务。在这类应用中,移动物体的位置受到特定技术手段(例如GPS(Global Positioning System,全球定位系统)技术)制约,存在一定的误差。尽管这项误差会随着技术手段的提升而逐步缩小,但是“位置隐私”问题却显得日益突出。移动物体的位置信息非常重要,有些用户并不愿意公诸于众,以免带来麻烦。“位置隐私”的目的是降低位置的精度——在某时刻,移动物体并非在某一空间“点”上,而是在一个“区域”内,从而保护了隐私。与此同时,各互联网服务提供商仍然能够根据这项“区域”信息提供相应的服务,例如,查询移动对象附近的医院、宾馆等设施。
索引技术是数据管理技术的重要内容。关系型数据库往往采用B+树及其变种为一维数据建立索引;在多维数据管理领域或时间-空间数据管理领域,广泛使用R树以及其变种进行索引。这些索引技术均能够大幅提高查询处理速度。同理,在处理不确定性数据中也需要关注索引问题。在某些查询任务中,例如top-k查询,元组的概率值也非常重要,因此需要针对概率维度创建一维索引,此时传统索引技术有效。但传统的索引技术无法解决所有问题。
当各元组的取值必须通过概率分布函数描述,且概率分布函数无法预先指定时,传统的索引技术索引效率将大幅降低,无法满足应用需求。
发明内容
本发明提供了一种数据索引方法和装置,解决了传统索引技术无法满足大型数据检索需要的问题。
一种数据索引方法,包括:
创建所述至少一个被索引对象R的索引树;
根据至少一个被索引对象的ID建立哈希结构;
在所述哈希结构中存储所述被索引对象在所述索引树中各位置的生命期。
优选的,所述创建至少一个被索引对象R的索引树包括:
创建最上层的TPR-Tree;
在所述TPR-Tree之下链接有至少一个2维R-Tree;
将各R-Tree通过哈希链接链接至一个一维R-Tree。
优选的,所述在所述哈希结构中存储所述被索引对象在所述索引树中各位置的生命期具体为:
在所述哈希结构中存储所述被索引对象处在所述TPR-Tree或所述2维R-Tree或所述一维R-Tree中的生命期。
优选的,上述数据索引方法还包括:
在对任一被索引对象进行时间间隔查询或时间片查询时,通过所述哈希结构查找所述被索引对象的生命期;
根据所述被索引对象在所述索引树中各位置对应的生命期,确定所述被索引对象对应索引在所述索引树中的位置。
优选的,所述生命期具体为被索引对象处于同一状态下持续的时间间隔。
本发明还提供了一种数据索引装置,包括:
索引树创建模块,用于创建所述至少一个被索引对象R的索引树;
哈希结构生成模块,用于根据至少一个被索引对象的ID建立哈希结构;
关联模块,用于在所述哈希结构中存储所述被索引对象在所述索引树中各位置的生命期。
优选的,所述索引树创建模块包括:
第一创建单元,用于创建最上层的TPR-Tree;
第二创建单元,用于在所述TPR-Tree之下链接有至少一个2维R-Tree;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210039265.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可拆卸式的具有人体工学结构的座椅
- 下一篇:储物箱式凳
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置