[发明专利]一种数据处理方法、存储系统以及存储介质在审
申请号: | 201910785718.9 | 申请日: | 2019-08-23 |
公开(公告)号: | CN112417058A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 王晨;谭春华 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/22;G06F16/2455 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 骆苏华 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 存储系统 以及 存储 介质 | ||
本申请实施例公开了一种数据处理方法、存储系统以及存储介质,该存储系统包括缓存,该缓存使用连续日志Plog承载数据,该方法用于缓存淘汰数据。当接收包括待读取数据的元数据的数据读取请求时,判断元数据指向的Plog所对应的数据是否保存在缓存中,若不在,则不读取Plog所对应的数据,而从存储系统的其他存储介质中读取待读取数据,使得即使删除了Plog,也不会造成数据读取失败,同时避免写放大增加或阻塞Plog的删除进程的问题。
技术领域
本申请涉及存储领域,尤其涉及一种数据处理方法、存储系统以及存储介质。
背景技术
日志结构的合并(The Log-Structured Merge,LSM)树是一种基于键值对(Key-Value)实现数据分层级存储的高效的数据索引结构。LSM树包括多层层级,每个层级包括多个子树,每个子树为一个元数据,作为键值对中的键(key),该元数据用于指向对应的连续日志(persistent log,Plog),即Plog作为键值对中的值(value)。在使用LSM树中写入数据的过程中,当某个层级的子树达到或超过该层级的上限时,该层级中的某个范围内的子树中的元数据以及这些元数据指向的数据将会合并到与下一层级中。存储系统对数据进行存储时,可以使用LSM树作为数据索引结构,将LSM树中第一层层级对应缓存存储器(以下简称缓存)中的数据,其他层级对应存储系统中其他存储介质中的数据。
缓存是存储系统中重要的存储器,具有极高的读写速度,有助于大幅度提高存储系统的整体性能。但是缓存的容量非常有限,当越来越多数据的写入缓存,缓存需要不断地将数据淘汰并写入存储系统的其他存储介质中,以腾出存储空间容纳热数据。缓存对数据的淘汰可以通过删除该数据对应的Plog来实现,但是如果直接删除Plog,那么当索引到指向被删除的Plog所对应的元数据时,会造成数据读取失败。
当前,有一种淘汰缓存数据的方案:缓存淘汰数据之前,可以首先遍历LSM树的每个子树,即元数据,以确定哪些元数据指向的需要删除的Plog,然后对这些元数据插入删除标记,使得这些元数据不能被索引到,因此不会发生数据读取失败的情况,从而可以安全删除这些元数据所指向的Plog。但是由于遍历LSM树的耗时较长,而且插入的删除标记较多,造成写放大增加。
当前,还有另一种淘汰缓存数据的方案:在存储系统中的数据进行LSM树的合并过程中,首先遍历参加合并的子树,即元数据,确定哪些元数据指向需要删除的Plog,然后直接删除这些指向需要删除的元数据,而不写入合并结果。由于这些元数据已经删除,无法被索引到,因此不会发生数据读取失败的情况,从而可以安全删除对应的Plog。但是由于合并过程较长,可能会阻塞Plog的删除进程。
发明内容
本申请实施例提供了一种数据处理方法、存储系统以及存储介质,其中,该方法应用于该存储系统,该存储系统包括缓存,该缓存使用Plog承载数据,该方法用于缓存淘汰数据。
为此,本申请实施例提供以下技术方案:
第一方面,本申请实施例提供一种数据处理方法,包括:当接收数据读取请求时,获取数据读取请求中包括的待读取数据的元数据,元数据用于指向对应于待读取数据的Plog,从而可以判断Plog所对应的数据是否保存在缓存中,若判断的结果为Plog所对应的数据不在缓存中时,可以不读取Plog所对应的数据,而从存储系统的其他存储介质中读取待读取数据,使得即使删除了Plog,也不会造成数据读取失败,同时避免写放大增加或由于在合并的过程较长而阻塞Plog的删除进程的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910785718.9/2.html,转载请声明来源钻瓜专利网。