[发明专利]管理存储装置中的数据的方法和系统有效
申请号: | 201680011434.9 | 申请日: | 2016-02-12 |
公开(公告)号: | CN107533507B | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | S·瑟哈德里;L·Y·赵;P·H·明奇 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F12/02 | 分类号: | G06F12/02 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 于静;张亚非 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 管理 存储 装置 中的 数据 方法 系统 | ||
提供一种用于管理存储装置中的数据的计算机程序产品、系统、以及方法。索引中的每个索引项标识记录中的一个记录在日志中的日志地址。所述日志中的每个记录包括键和值,并且所述日志地址映射到所述存储装置中的物理地址。处理所述日志中的多个被处理日志地址,方式为:判定所述索引是否指示该被处理日志地址包括所述日志中的所述记录的当前版本;响应于判定所述索引指示该被处理日志地址包括所述记录的当前版本,将该被处理日志地址处的所述记录添加到所述日志中的选定的日志地址;以及删除所述存储装置中该被处理日志地址映射到的所述物理地址处的记录。
技术领域
本发明涉及用于根据日志结构管理存储装置中的数据的计算机程序产品、系统、以及方法。
背景技术
在日志结构化存储系统中,对数据的更新未被就地写入,而是被写入选定的逻辑和物理地址。数据可以被存储在键-值存储库中,其中数据被存储在非结构化记录中,所述非结构化记录由键加上与该记录关联的值组成。可以使用具有日志中的记录的键和日志地址的索引来查找记录在日志中的日志地址。每个索引项具有在命名空间或数据集中唯一的索引键以及日志中的数据的地址。
在日志结构化存储装置中,更新被写入日志的一端,并且保留日志中的记录的先前版本。当日志中的日志地址处的项不再具有标识日志地址的对应索引项时,则日志中的项被视为未使用并且能够被垃圾回收。但是,因为垃圾回收的粒度(“区域/槽”)比数据的粒度(键-值记录)大得多(更粗糙),为了对整个槽进行垃圾回收,槽中的某些潜在有效项可能必须被重新定位。为了查找索引仍然指向旧位置的重新定位项,存储层可以维护将旧项映射到新项的间接表。当索引不可用于提供记录的当前地址时,间接表用于将指向旧地址的记录的请求重定向到新地址。间接导致更长的查找时间和将旧地址映射到新地址的性能损失,新地址然后必须被映射到物理地址以便访问记录。
用于执行垃圾回收的另一种技术是压缩过程,其读取所有数据并且将它们重写到回收空间。这需要移动活动(live)数据和旧数据以便释放空间以使其可用于随后接收的数据。压缩是输入/输出密集型的,因为需要读取活动数据和被删除数据并且将它们重写到新空间。
在存储层在日志中放置指示过时记录的墓碑记录(tombstone record)的实施例中,垃圾回收必须扫描日志以处理墓碑记录以便确定要删除的记录。
本领域中需要用于执行存储系统并且特别地日志结构化存储系统中的垃圾回收的改进的技术。
发明内容
根据第一方面,提供一种用于管理存储装置中的数据的计算机程序产品,所述计算机程序产品包括计算机可读存储介质,所述计算机可读存储介质具有包含在其中的计算机可读程序代码,所述计算机可读程序代码执行以便执行操作,所述操作包括:提供对日志中的记录的索引,其中所述索引中的每个索引项标识所述记录中的一个记录在所述日志中的日志地址,其中所述日志中的每个记录包括键和值,并且其中所述日志地址映射到所述存储装置中的物理地址;处理所述日志中的多个被处理日志地址,方式为:对于所述日志地址中的每个日志地址,执行以下操作:判定所述索引是否指示该被处理日志地址包括所述日志中的所述记录的当前版本;响应于判定所述索引指示该被处理日志地址包括所述记录的当前版本,将该被处理日志地址处的所述记录添加到所述日志中的选定的日志地址;以及删除所述存储装置中该被处理日志地址映射到的所述物理地址处的记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680011434.9/2.html,转载请声明来源钻瓜专利网。