[发明专利]一种采用后缀数组索引的海量小文件查询方法及系统有效
申请号: | 201811133108.2 | 申请日: | 2018-09-27 |
公开(公告)号: | CN109284273B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 赵鑫;孙茜;农革 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/13;G06F16/16 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种采用后缀数组索引的海量小文件查询方法。本发明通过合并小文件后存储到分布式文件系统上提高空间利用率,同时对每一个小文件建立后缀数组索引记录其存储信息以及小文件本身属性信息,并提供有效的小文件更新方法,支持多种方式的小文件查询,避免了传统的单一低效的海量小文件查询,保证了查询的即时性、准确性、高效性。解决了现有技术中简单合并小文件导致小文件查询方式单一、读取效率低下、小文件更新困难、查询即时性差等问题。 | ||
搜索关键词: | 一种 采用 后缀 数组 索引 海量 文件 查询 方法 系统 | ||
【主权项】:
1.一种采用后缀数组索引的海量小文件查询方法,其特征在于,包括:小文件存储步骤:客户端提交文件上传请求;获取每个文件大小,对文件大小进行判断,若判断为非小文件,则对文件分别建立后缀数组索引并上传到分布式文件系统;若判断为小文件,则将小文件放入合并队列进行合并,对小文件分别建立后缀数组索引并将合并后的文件上传到分布式文件系统。小文件查询步骤:获取并解析查询请求;确定查询类型;确定要查询的指定域及查询条件;根据查询条件在后缀数组索引中搜索指定域,得到符合条件的后缀数组索引记录;根据后缀数组索引记录获取小文件在分布式文件系统中的位置信息,从分布式文件系统上获取对应小文件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811133108.2/,转载请声明来源钻瓜专利网。