[发明专利]控制RAID阵列重建的装置和方法无效
申请号: | 200710109137.0 | 申请日: | 2007-06-13 |
公开(公告)号: | CN101093460A | 公开(公告)日: | 2007-12-26 |
发明(设计)人: | P·N·卡什曼 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F11/20 | 分类号: | G06F11/20 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 于静;杨晓光 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 控制 raid 阵列 重建 装置 方法 | ||
技术领域
本发明涉及用于控制阵列重建的技术,更具体地说,涉及用于在有可能失败的阵列重建期间维护数据可用性的技术。
背景技术
在廉价磁盘冗余阵列(RAID阵列)的某些布置中,提供了使用来自阵列中其他盘的数据来从出现故障的盘重建数据的工具。这通常通过将每个盘的数据的副本分发(以条带形式分布)到阵列中的其他盘,以便在盘出现故障时可以取回所述副本并在备用盘上将它们组装到一起来实现。最近,产生了抢先重建的概念。在这种情况下,将确定为处于故障点的盘(例如,由达到预定阈值(指示盘的即将发生的完全故障)的暂时或可恢复错误的计数来检测)在出现即将发生的故障之前抢先复制到备用设备。
在RAID阵列重建期间,出现故障的硬件和固件可以遇到阻止阵列重建完成及可以导致无法访问数据的重复错误。具体地说,盘驱动器模块固件可以根据例如错误定阈值机制来指示上述预测性的故障。此指示又可以用于启动从出现故障的组件到其他组件的抢先数据重建,以便通过减少准备备用盘驱动器模块所花费的时间来提高系统可用性,同时降低数据损失的可能性-如果抢先数据重建成功完成的话,而无需使用常规的从所有其他阵列组件回读数据的技术。
在抢先数据迁移期间,如果出现导致RAID操作失败的错误,则可能危及恢复。这是因为除非存在某种更高级别的控制,否则系统指定的恢复操作会持续重试,这只是重复失败的操作。这种重复可以最终导致无法访问数据甚至数据自身的丢失。
在RAID阵列重建期间维护数据可用性的问题的一个已知方法的实例是推迟重建恢复,直至控制软件指示其准备好进行此类恢复。尽管该方法可以在某些情况下具有可以接受的结果,但是它仍取决于是错误原因的重建操作自身。在一个备选方法中,可以具有在初始化阵列组件之前忽略它们的机制。但是,这也易于出现错误,因为预测由于某个原因而处于故障点的驱动器可以由于其他未预见的原因出现故障。其他备选方法是使用带外信令绕过出现故障的盘驱动器模块。但是,这在资源使用上是昂贵的并且可能在技术上不可行(例如,在长FC-AL电缆上路由通信的情况)。使用多个控制器同样不太可能提供任何益处,因为它们很可能运行相同的代码,所以它们容易发生相同的错误。此外,编写完全独立的解决方案以在不同控制器上使用将是极其昂贵的。
因此,需要一种控制RAID阵列重建的技术方法,具体地说,需要一种用于在可能失败的阵列重建期间维护数据可用性而不带来过多其他开发成本的技术方法。
发明内容
相应地,本发明在第一方面提供了一种控制具有多个通信路径的存储阵列的装置,所述装置包括:第一错误检测组件,用于检测具有多个端口并可操作以为抢先重建提供数据的设备处的错误;端口控制组件,用于在所述设备处禁用除单个端口之外的所有所述多个端口;抢先重建组件,用于使用所述设备处的所述多个端口中的所述单个端口来将数据从所述设备复制到备用设备;备选路径维护组件,用于维护备选路径以供所述存储阵列的其他成员使用并绕过所述设备;第二错误检测组件,用于在所述抢先重建组件的操作期间检测所述设备处的错误;以及设备禁用组件,其响应于所述第二错误检测组件以禁用所述没备。
所述装置优选地还包括非抢先重建组件,该组件用于使用来自所述存储阵列的所述其他成员的数据并使用绕过所述设备的所述备选路径来在备用设备处重建数据。
优选地,所述用于使用来自所述存储阵列的所述其他成员的数据在备用设备处重建数据的非抢先重建组件包括用于从以条带形式分布在所述存储阵列的所述成员间的异或后的数据来重建数据的RAID重建组件。
优选地,所述第一错误检测组件、所述端口控制组件、所述抢先重建组件、所述备选路径维护组件、所述第二错误检测组件,以及所述设备禁用组件都结合在设备控制器中。
在第二方面,本发明提供了一种控制具有多个通信路径的存储阵列的方法或逻辑布置,其包括以下步骤:由第一错误检测组件检测具有多个端口并可操作以为抢先重建提供数据的设备处的错误;在所述设备处禁用除单个端口之外的所有所述多个端口;使用所述设备处的所述多个端口中的所述单个端口来将数据从所述设备复制到备用设备;维护备选路径以供所述存储阵列的其他成员使用并绕过所述设备;在所述抢先重建的操作期间由第二错误检测组件来检测所述设备处的错误;以及响应于所述由第二错误检测组件检测错误的步骤,禁用所述设备。
所述方法优选地还包括使用来自所述存储阵列的所述其他成员的数据并使用绕过所述设备的所述备选路径来在备用设备处重建数据的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710109137.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:输入电路及其方法
- 下一篇:微晶玻璃构成的信息记录介质用基片及信息记录介质