[发明专利]一种海量历史数据的存储及索引方法无效
申请号: | 201210063417.3 | 申请日: | 2012-03-12 |
公开(公告)号: | CN102646130A | 公开(公告)日: | 2012-08-22 |
发明(设计)人: | 王非;黄本雄;王章 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市德权律师事务所 11302 | 代理人: | 刘丽君 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种海量历史数据的存储及索引方法,属于实时历史数据库领域。该方法根据分布式文件系统将大文件进行分块存储的特点,给出了一种简单高效的海量历史数据文件的存储方法和一种高效的分布式索引机制。该存储方法可以保证满足当前海量历史数据文件的存储要求,更保证具有在线扩展的特性;索引机制可以实现对海量历史数据的快速访问,同时在系统进行资源扩展以后,即底层物理存储发生变化时,该索引在无需修改的情况下依旧可以实现对数据的查找功能。 | ||
搜索关键词: | 一种 海量 历史数据 存储 索引 方法 | ||
【主权项】:
一种海量历史数据的存储方法,其特征在于,该方法包括:A、从实时历史数据库获取与测点数字标识NID相对应测点的前一天全天的压缩数据,按时间升序连续排列构成一条测点历史数据记录的历史数据区,在所述历史数据区前加入该测点的元数据区信息构造一条测点历史数据记录R;B、判断中间数据文件FT的剩余空间是否小于R的长度RLEN,如果是,则向FT的剩余空间写入无效数据,并将FT中的整块数据追加写入历史数据文件F,从分布式文件系统返回的结果中获取本次写入数据所存入的文件块的全局数字标识BlockID,遍历保存测点数字标识的集合CID,每次取出一个测点数字标识赋值给临时变量TID,将日索引集合文件FTi的第TID个索引单元的文件块标识FileBlockID项的值置为BlockID,清空CID和文件FT,并执行步骤C;否则直接执行步骤C;C、将R写入FT,记录下R在FT中的起始偏移地址Offset,将Offset和RLEN分别写入日索引集合文件FTI的第NID个索引单元的数据偏移DataOffset项和数据长度DataLength项,将NID的值存入集合测点数字标识的集合CID;D、对NID的值执行加1操作,判断新NID对应的测点是否存在,若存在则执行步骤A;否则执行步骤E;E、向FT的剩余空间写入无效数据,将FT中的数据追加写入历史数据文件F,从分布式文件系统返回的结果中获取本次写入数据存入的文件块的全局数字标识BlockID,更新FTI,遍历CID,每次取出一个测点数字标识赋值给临时变量TID,将FTI中第TID个索引单元文件块标识FileBlockID项的值置为BlockID,将FTI的数据追加写入年索引文件FIDX。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210063417.3/,转载请声明来源钻瓜专利网。
- 上一篇:影像系统及其干扰消除方法
- 下一篇:基站天线装置及基站天线工程参数采集装置