[发明专利]一种基于混合页面的磁盘缓存去重方法有效
申请号: | 201910565354.3 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110321079B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 邓玉辉;斯雷 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06F3/06 | 分类号: | G06F3/06;G06F12/123 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈燕娴 |
地址: | 510632 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 页面 磁盘 缓存 方法 | ||
1.一种基于混合页面的磁盘缓存去重方法,其特征在于,所述的磁盘缓存去重方法包括以下步骤:
S1、磁盘在进行数据的读写时,巨页产生器从应用程序中读入初始页面地址,将连续的基页进行合并,生成相应巨页;所述的应用程序中读入的初始页面地址是固定的,应用程序开始工作时,巨页产生的步骤如下:
S11、巨页产生器从应用程序中读入初始页面地址;
S12、检测初始页面地址是否连续,若存在固定数量的连续初始页,则将其合并为巨页;
S13、对合并的巨页相应字段进行填充,保证巨页字段的完整性;
S2、页面监视器对磁盘缓存中基页和巨页的访问频率进行实时监测,若巨页的访问频率较低,则将巨页拆分为若干个连续的基页,若基页的访问频率变高,则又将连续基页重构为巨页;过程如下:
S21、对基页和巨页的访问频率进行实时检测;
S22、当所检测的页为巨页,并且该页的访问频率较低时,则将该巨页拆分为若干个连续的基页,并对每个拆分后基页的各个字段进行相应内容的填充,而当该页的访问频率较高时,则保留不进行操作;
S23、当所检测的页为拆分后的基页,并且该页的访问频率由低变高时,则又将拆分后的连续基页进行重构操作,合并为巨页;
S3、将调整后的基页和巨页分别进行去重操作,采用固定分块的重复数据删除方法,利用MD5算法对数据块进行指纹计算,识别出重复的数据块,在缓存中只保留唯一的数据块。
2.根据权利要求1所述的一种基于混合页面的磁盘缓存去重方法,其特征在于,所述的步骤S3中基页和巨页的去重操作过程如下:
S31、采用固定分块的重复数据删除方法,利用MD5算法对数据块进行指纹计算,相应指纹对应于页面的hash值;
S32、对基页和巨页中的重复数据块进行指纹比对,若两个数据块的指纹完全相同,则认为这两个数据块完全一致,为重复的数据块,否则为唯一数据块;
S33、当识别到重复数据块后,指纹索引计数器开始累加,以统计相同数据块出现的次数,对于多次出现的相同数据块,将其指向数据缓存链表中相应的唯一数据块;当检测的数据块为唯一数据块时,将其添加到数据缓存链表,并对其相应的元数据缓存链表进行添加。
3.根据权利要求2所述的一种基于混合页面的磁盘缓存去重方法,其特征在于,所述的数据缓存链表用以保存去重后的唯一数据块,所述的元数据缓存则用以保存页的访问顺序。
4.根据权利要求1所述的一种基于混合页面的磁盘缓存去重方法,其特征在于,所述的巨页由连续的基页组成,并且内部对每个基页都进行编号,基页地址在转换过程中并未变化,对于组成巨页的每个基页,可通过编号计算出页内偏移量,然后利用巨页起始地址得到巨页内部每个基页的地址。
5.根据权利要求1所述的一种基于混合页面的磁盘缓存去重方法,其特征在于,在基页与巨页之间进行动态转换,基页大小由操作系统所决定,巨页大小需要根据实际的应用负载进行调整,而巨页、基页之间的转换需要实时地监测页面的访问频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910565354.3/1.html,转载请声明来源钻瓜专利网。