[发明专利]一种数据预取方法、装置、电子设备及存储介质在审

专利信息
申请号: 202111473813.9 申请日: 2021-11-30
公开(公告)号: CN114138687A 公开(公告)日: 2022-03-04
发明(设计)人: 毛宏华;汪少杰;侯超 申请(专利权)人: 新华三大数据技术有限公司
主分类号: G06F12/0862 分类号: G06F12/0862
代理公司: 北京三聚阳光知识产权代理有限公司 11250 代理人: 陈刚
地址: 450000 河南省郑州市高新技*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 方法 装置 电子设备 存储 介质
【说明书】:

本申请公开了一种数据预取方法、装置、电子设备及存储介质。方法包括:获取数据预取指令,数据预取指令用于从目标磁盘中预取访问次数大于预设次数的被访问数据;根据数据预取指令,调用被访问数据对应的访问地址序列;将访问条件概率满足预取条件的序列单元确定为目标序列单元,并确定目标序列单元的目标序列标识对应的目标逻辑块地址;从目标磁盘中获取与目标逻辑块地址相匹配的目标逻辑块,并将目标逻辑块中的目标数据写入目标存储介质。本申请通过根据逻辑块地址的访问条件概率从目标磁盘中满足预取条件的逻辑块,并将该逻辑块中存储的数据写入目标存储介质,相比现有技术不再需要去磁盘中读取数据,缩短了访问路径,提高了数据读取效率。

技术领域

本申请涉及计算机技术领域,尤其涉及一种数据预取方法、装置、电子设备及存储介质。

背景技术

分布式存储系统一般都会通过缓存来缩短前台IO路径,从而达到降低时延提升系统性能的目的。如图2所示,读IO如果要从disk读取数据,IO路径将很长,需要经过接口层、加速层、存储层里面各个模块,而且需要通过多次网络,由于访问路径太长导致时延增加,目前可见的方案是通过加大read cache的物理空间,比如使用更大的内存,或通过SCM/NVME SSD来缓存数据,read cache空间的增加,能提升随机读命中率,但是效果甚微。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种数据预取方法、装置、电子设备及存储介质。

根据本申请实施例的一个方面,提供了一种数据预取方法,包括:

获取数据预取指令,其中,所述数据预取指令用于从目标磁盘中预取访问次数大于预设次数的被访问数据,所述目标磁盘部署在所述分布式存储系统的存储层;

根据所述数据预取指令,调用所述被访问数据对应的访问地址序列,其中,所述访问地址序列包括多个序列单元,每个序列单元包括与所述被访问数据关联的序列标识以及访问条件概率;

将所述访问条件概率满足预取条件的序列单元确定为目标序列单元,并确定所述目标序列单元的目标序列标识对应的目标逻辑块地址;

从目标磁盘中获取与所述目标逻辑块地址相匹配的目标逻辑块,并将所述目标逻辑块中的目标数据写入目标存储介质,其中,所述目标存储介质部署在所述分布式系统中的加速层。

进一步的,在根据所述数据预取指令,调用所述被访问数据对应的访问地址序列之前,所述方法还包括:

获取历史访问记录,其中,所述历史访问记录包括:多个被访问的逻辑块地址,以及每个所述逻辑块地址对应的被访问时间和访问参数;

基于所述访问参数计算所述逻辑块地址对应的访问条件概率;

根据每个所述逻辑块地址对应的访问参数以及访问条件概率,生成所述逻辑块地址对应的序列单元;

按照所述序列单元标识对所述逻辑块地址对应的序列单元进行排序,生成所述访问地址序列。

进一步的,所述访问参数包括:所述逻辑地址块对应的访问次数;

所述基于所述访问参数计算所述逻辑块地址对应的访问条件概率,包括:

根据所述历史访问记录中全部逻辑块地址对应的访问次数求和,得到访问总次数;

基于所述逻辑块地址对应的访问次数以及所述访问总次数,计算所述逻辑块地址对应的第一访问概率;

获取所述逻辑块地址对应的第二访问概率,其中,所述第二访问概率是逻辑块地址在随机条件下被访问的概率;

基于所述第一访问概率和所述第二访问概率,计算所述访问条件概率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三大数据技术有限公司,未经新华三大数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111473813.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top