[发明专利]一种分布式文件系统多级缓存实现方法有效
申请号: | 201410508442.7 | 申请日: | 2014-09-28 |
公开(公告)号: | CN104317736B | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 张攀勇;彭成;季旻;苗艳超 | 申请(专利权)人: | 曙光信息产业股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京安博达知识产权代理有限公司11271 | 代理人: | 徐国文 |
地址: | 300384 天津市西青区华*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 文件系统 多级 缓存 实现 方法 | ||
技术领域
本发明涉及一种实现方法,具体涉及一种分布式文件系统多级缓存实现方法。
背景技术
随着分布式文件系统的广泛应用,其提供的存储容量和节点规模变得越来越大,系统对分布式系统提供的文件操作的性能和可扩展性提出了更高的要求。在分布式系统中客户端的文件访问请求,经过元数据服务器进行解析之后,客户端文件请求最终会变成对数据服务器上的对应文件对象操作,对于数据服务器的对象读写操作性能直接决定了分布式文件系统的性能。
而现有磁盘在容量和操作速度上相比CPU,内存,网络来说存在数量级的差异,为了平衡速度的差异,缓存技术在分布式文件系统中广泛使用,利用访问的局部性原理,将访问尽可能的在快速设备上操作,以减少对慢速设备的访问,提高系统的访问带宽。由于单机文件系统是分布式文件系统的基本组成部分,数据节点上的文件系统的缓存效率直接关系到分布式文件系统的整体效率。单机文件系统一般使用本机内存作文件缓存,通过缓存文件写和文件预读操作,极大的提高了本地文件的操作性能,典型的代表有Linux系统的Page cache系统,在内存实现了一个文件系统缓存。
新型存储介质如固态硬盘(Solid State Disk,SSD)和NVRAM(Non-Volatile RAM),由于其优异的读写性能,被广泛应用于内存和磁盘之间,作为数据缓存,用来保留读取的热点数据和写入的数据,提高存储系统的读写效率。典型的代表有Facebook公司的flashcache技术等。
分布式系统的基于内存的缓存系统,已经在互联网服务等领域得到广泛的应用,典型的系统如MemCached系统,其在多个节点之间构建一个全局的基于内存的键值存取系统(Key-Value Store),缓存网站的后端数据库查询结果等操作,以加速网站的访问效率。
然而上现有技术存在如下问题:
1)全局特性考虑较少:由于分布式文件系统由多个节点组成,需要一种全局缓存技术来协同考虑,缓存分布式文件系统的访问请求,并提供一致,高效的文件操作。单机缓存系统在全局方面考虑较少。
2)设备支持简单:现有缓存设备在访问速度和容量上存在较大差距,需要缓存系统支持多种设备,而现有缓存系统支持较为简单。
3)故障处理简单:分布式缓存系统由于分布在多个不同节点,节点或者缓存设备存在故障时,需要分布式缓存系统仍然能正确高效的提供缓存服务。
发明内容
为了克服上述现有技术的不足,本发明提供一种分布式文件系统多级缓存实现方法,将多种不同分布在不同节点上的缓存设备聚合在分布式缓存中,向分布式文件系统提供高效的文件数据缓存服务,并且容忍各种系统故障,保证分布式缓存的正确性。
为了实现上述发明目的,本发明采取如下技术方案:
本发明提供一种分布式文件系统多级缓存实现方法,所述方法包括以下步骤:
步骤1:识别分布式文件系统的缓存设备,并进行管理;
步骤2:构建全局缓存元数据服务;
步骤3:客户端文件数据操作解析;
步骤4:全局缓存层文件数据分布;
步骤5:全局缓存层文件数据保护处理。
所述步骤1中,分布式文件系统的缓存层由多级全局缓存层组成,每级全局缓存层由分布在不同缓存节点上的缓存组成,全局缓存层的存储介质包括内存卡、固态硬盘、非易失性随机访问存储器、磁盘阵列和磁盘等。
所述缓存节点上的缓存并不相同,且至少存在一种缓存;
缓存节点的物理形态存在于元数据节点或数据节点上,与元数据和数据服务共用服务器或单独使用缓存服务器,该缓存服务器只提供缓存服务;
缓存节点之间使用高速网络连接,通过消息交互共同完成分布式文件系统缓存层的功能。
所述步骤2中,在分布式文件系统的元数据服务中间增加全局缓存元数据服务,全局缓存元数据服务负责实现分布式文件系统全局缓存层的管理,客户端通过全局缓存元数据服务获取到文件数据对应的缓存,并负责缓存的状态维护;全局缓存元数据服务分布在多个缓存节点上。
全局缓存元数据服务包括位置解析、状态监控、频度监控和任务控制;
位置解析负责客户端发起的文件数据位置解析,返回文件数据所在的全局缓存层,以及在缓存节点的具体位置信息;
状态监控用于监控缓存节点的状态,如果出现故障,对出现故障的缓存节点上的脏缓存实现缓存重建任务;
频度监控用于监控缓存中的文件数据访问频度,并根据访问频度生成文件数据在全局缓存层之间的调度任务;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业股份有限公司,未经曙光信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410508442.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种非织造布在线分切设备
- 下一篇:垂直式多出风管暖风干衣机