[发明专利]紧耦合高性能计算机系统BMC系统自动修复方法及修复系统在审

专利信息
申请号: 201910839696.X 申请日: 2019-09-06
公开(公告)号: CN111124749A 公开(公告)日: 2020-05-08
发明(设计)人: 吴智;张春林;韩小虎;张祯;建澜涛;黄益明 申请(专利权)人: 无锡江南计算技术研究所
主分类号: G06F11/14 分类号: G06F11/14;G06F11/30;G06F9/445;G06F16/182
代理公司: 浙江千克知识产权代理有限公司 33246 代理人: 雷娴
地址: 214100 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 耦合 性能 计算机系统 bmc 系统 自动 修复 方法
【说明书】:

本发明属于高性能计算机系统维护领域,尤其涉及紧耦合高性能计算机系统BMC系统自动修复方法及修复系统。其特征在于,包括:管理系统监测到BMC启动失败时,控制其重新启动,从网络文件服务系统获取启动所需的BMC启动文件并将所述BMC启动文件加载到其内存中运行。上述技术方案中,只需将BMC启动所需的BMC启动文件存储在远程文件系统中,如果BMC由于Flash坏块引起系统崩溃导致启动失败时,能够通过远程的网络文件系统获取启动所需的文件实现自动修复。仅需在远程文件系统中占用存储一份BMC启动文件的空间即可供计算机系统中的众多节点的BMC系统共享,节省资源方便维护并且众多节点的BMC可同时从网络文件系统获取BMC文件提高了维护效率。

技术领域

本发明属于高性能计算机系统维护领域,尤其涉及一种面向高性能计算机系统的BMC系统自动修复方法。

背景技术

随着高性能计算机运算性能的不断提升,主机系统包含的节点数量剧增,因此以维护节点为主要任务的分布式维护系统的规模也在随之增加。目前在紧耦合高性能计算系统中部署有数量极大的基板管理控制器(BMC),作为维护系统的重要部件,其自身的可靠性尤为重要。

BMC的核心部件为嵌入式系统,通常BMC都将自身操作系统文件存储于大容量Flash中,由于Flash的自身特性,存在一定概率的坏块和失效,会导致BMC系统引导时出现失败。目前一种改进的做法是使用两级存储,将bootloader存储于可靠性更优但是单位价格更高的容量较小的Nor Flash中,将内核和文件系统存储于可靠性稍差但是容量更大的eMMC nand Flash中,当eMMC nand Flash出现坏块导致内核或者文件系统故障时,常规做法是进行离线重烧。但此种方法在大规模系统中实施起来效率很低,导致平均故障修复时间较长,维护系统的可靠性和可用性也随之降低。

申请公布号CN103246583A,申请公布日2013年8月14日的发明专利申请公开的是一种具有CPU BIOS修复功能的电子装置及修复方法。该电子装置包括一用于CPU系统与外接装置电连接的连接端口,CPU的引导模块在检测到自身BIOS版本错误,通过向与CPU有电连接的外接装置发送指令,从外接装置复制存储的CPU BIOS至闪存。使得CPU在不能正常加载闪存中的BIOS时,能够加载与该电子装置连接的外接装置中的BIOS。此种方法主要针对BIOS更新,BIOS文件特点是占用空间很小,因此可以多份存在外界装置本地。本申请主要要解决的问题是内核、根文件系统的修复,特点是占用空间较大,不适合存在本地嵌入式系统有限的存储空间上。另外,在公布的方法中,BIOS版本检测、版本查找、更新等整个过程都是由待修复CPU系统发起,这对待修复CPU系统要求较高,CPU启动固件也较为复杂,不适用于功能与普通CPU系统相比较更简单的嵌入式系统的修复。

在紧耦合高性能计算系统中,全系统的BMC通过以太网进行连接,为了提高维护效率,一般会设计出树型管理架构,也就是在第一层BMC之上设置有管理系统,用于对BMC的管理。

发明内容

本发明旨在让BMC能自动从由于Flash坏块引起的系统崩溃中恢复,提高高性能计算机系统的维护系统自身的可靠性,提供一种面向紧耦合高性能计算机系统的BMC系统自动修复方法,其特征在于,包括:

BMC在启动失败时从网络文件服务系统获取启动所需的BMC启动文件并将所述BMC启动文件加载到其内存中运行。

上述技术方案中,只需将BMC启动所需的BMC启动文件存储在远程文件系统中,如果BMC由于Flash坏块引起系统崩溃导致启动失败时,能够通过远程的网络文件系统获取启动所需的文件实现自动恢复。仅需在远程文件系统中占用存储一份BMC启动文件的空间即可供计算机系统中的众多节点的BMC系统共享,节省资源方便维护并且众多节点的BMC可同时从网络文件系统获取BMC文件提高了维护效率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910839696.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top