[发明专利]一种基于Ceph的海量小文件存取优化方法有效

专利信息
申请号: 201810343960.6 申请日: 2018-04-17
公开(公告)号: CN108710639B 公开(公告)日: 2021-05-14
发明(设计)人: 王勇;陆小霞;叶苗;郇宜鸣 申请(专利权)人: 桂林电子科技大学
主分类号: G06F16/16 分类号: G06F16/16;G06F16/172;G06F16/13;G06F16/182
代理公司: 桂林市持衡专利商标事务所有限公司 45107 代理人: 陈跃琳
地址: 541004 广西*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种基于Ceph的海量小文件存取优化方法,当用户存储文件时,先利用K‑means聚类算法获得小文件的关联分组,再对每组内的文件按从大到小的顺序进行排序,然后将关联分组内的关联文件进行合并后再存储至Ceph中。当用户发起访问请求时,系统先检查请求文件是否在缓存中,若存在直接读取并返回请求文件;否则将请求信息发送到Ceph集群,实现小文件的读取并根据文件块间的利用率及相关率进行小文件的预取及缓存,返回请求文件及预取小文件。该发明通过减少用户与集群的交互,减少用户访问时间,提高海量小文件的访问效率,提高系统的整体性能。
搜索关键词: 一种 基于 ceph 海量 文件 存取 优化 方法
【主权项】:
1.一种基于Ceph的海量小文件存取优化方法,其特征是,包括步骤如下:步骤1、获取客户端同一时段内待上传的文件的文件的文件名和文件大小,并根据设定的文件阈值对这些文件进行分类:当待上传的文件的大小大于文件阈值时,则判定为大文件,直接上传到Ceph集群;当待上传的文件的大小等于或小于文件阈值时,则判定为小文件;步骤2、利用K‑means聚类算法对小文件进行关联分组,并对各个分组内的小文件按照文件大小从大到小进行排序,再将各分组内的小文件依次进行合并后上传到Ceph集群,同时根据小文件在合并文件内的映射关系生成索引文件;步骤3、当用户发出访问请求时,客户端判断请求文件是否在客户端的缓存中:若在客户端的缓存中,则直接从客户端的缓存中直接访问该请求文件;否则,客户端将请求信息上传Ceph集群;步骤4、Ceph集群接收请求信息,并根据请求文件的文件名确定其文件类型,若请求文件为大文件时,则直接从Ceph集群中读取该请求文件,并存储到客户端缓存中供用户访问,若请求文件为小文件时,则先根据索引文件确定请求文件在合并文件中的具体位置信息,再从Ceph集群中读取该请求文件,并存储到客户端缓存中供用户访问。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810343960.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top