[发明专利]使用多级单元设置本地检查点无效
申请号: | 201280068638.8 | 申请日: | 2012-04-27 |
公开(公告)号: | CN104081357A | 公开(公告)日: | 2014-10-01 |
发明(设计)人: | 尹大贤;罗伯特·施赖贝尔;保罗·法拉博斯基;常继川;纳温·穆拉利马诺哈尔;帕塔萨拉蒂·兰加纳坦 | 申请(专利权)人: | 惠普发展公司;有限责任合伙企业 |
主分类号: | G06F11/08 | 分类号: | G06F11/08;G06F12/16;G11C7/24;G11C16/00 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 郭艳芳;康泉 |
地址: | 美国德*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 多级 单元 设置 本地 检查点 | ||
政府利益的声明
本发明根据由能源部授予的合同号DE—SC0005026在政府支持下做出。政府对本发明有某些权利。
背景技术
高性能计算(HPC)系统一般用于复杂数学和/或科学信息的计算。这样的计算可包括化学相互作用的模拟、信号分析、结构分析的模拟等。由于它们的复杂性,HPC系统完成这些计算常常是明显耗费时间的(例如小时、天、星期等)。例如硬件故障、应用程序漏洞、存储器毁坏、系统故障等的错误可能在计算期间出现,并将所计算的数据保持在毁坏和/或不一致的状态。当这样的错误出现时,HPC系统重新开始计算,这可明显增加完成计算的处理时间。
为了缩短重新计算的处理时间,利用检查点来在计算期间存储在不同点处所计算的数据的版本。当错误出现时,计算系统从最近的检查点恢复数据,并从恢复的检查点重新开始计算。以这种方式,检查点可用于通过防止系统必须完全重新开始计算来减少计算的处理时间。
附图说明
图1描绘示例性多级单元(MLC)非易失性随机存取存储器(NVRAM)配置。
图2是使用图1的MLC NVRAM的示例性存储块的方框图。
图3是可用于使用图2的示例性存储块来实现本地检查点的示例性存储控制器的方框图。
图4是每个单元具有两个位的多级单元的方框图。
图5是每个单元具有两个位的可替代多级单元的方框图。
图6是每个单元具有三个位的多级单元的方框图。
图7是每个单元具有四个位的多级单元的方框图。
图8是每个单元具有四个位的多级单元的方框图。
图9是表示可被执行来实现图3的示例性存储控制器以执行检查点操作的示例性机器可读指令的流程图。
图10是表示可被执行来实现图3的示例性存储控制器以执行检查点操作的示例性机器可读指令的流程图。
图11是代表可被执行来实现图3的示例性存储控制器以执行电阻编码的示例性机器可读指令的流程图。
图12是能够执行图9、10和/或11的示例性机器可读指令以实现图3的示例性存储控制器的示例性处理器平台的方框图。
具体实施方式
本文公开的示例性方法、装置和制品能够使用多级单元(MLC)非易失性随机存取存储器(NVRAM)来实现版本存储器。为了实现版本存储器,本文公开的例子利用多级单元(MLC)来对工作数据和一个或多个数据检查点进行编码。示例性工作数据存储在多级单元的第一位中,而示例性检查点数据存储在多级单元的第二位中。本文公开的示例性版本存储技术可用于实现比已知的检查点技术相对更快和更能量有效的检查点。
最近的NVRAM存储技术(例如相变存储器(PCRAM)、忆阻器等)比传统的存储技术具有更高的存储密度。这样的较高密度NVRMA存储技术被预期用在较新的计算系统中。然而,设计者、工程师和用户面临着由于例如存储器泄漏、系统故障、应用程序漏洞等错误产生的NVRAM毁坏的风险。因此,本文公开的例子可用于将NVRAM中的数据恢复到稳定的状态,以消除或实质上降低毁坏的风险。
已知的系统使用多版本数据结构、检查点日志过程等来实现从错误中恢复。然而,在这种以前的系统中使用多版本数据结构需要可访问那些多版本数据结构的特别设计的软件应用程序。因此,这些已知数据结构的使用限于具有这样特别设计的软件应用程序的计算系统。在一些已知的系统中,检查点日志过程依赖于将存储器拷贝到分开的位置以创建检查点的能力。然而,因为利用很多存储操作来创建检查点,因此拷贝存储器可能花费过长的时间,且可能易于发生错误。为了克服错误,检查点日志系统创建所拷贝的数据的日志,以在检查点过程期间能够从错误中恢复。然而,这些机制引起性能和能力的相当大的开销。
本文公开的示例性方法、装置和制品在高性能计算(HPC)系统中实现检查点。本文公开的例子通过将检查点数据存储在同一多级单元的额外层中来实现示例性检查点操作,其中工作数据存储在额外层中。通过将检查点数据存储在同一单元中,该数据可更容易寻址,且存储器写操作相对更快,这是因为正被设置检查点的数据未被传输到单独的存储位置(例如远程检查点服务器、在同一计算系统中的单独存储设备、计算系统的同一存储设备的单独存储位置等)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普发展公司;有限责任合伙企业,未经惠普发展公司;有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280068638.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:地图绘制装置、导航装置以及地图绘制方法
- 下一篇:用于运行处理器的方法