[发明专利]用于故障管理的方法、设备和计算机程序产品在审
申请号: | 201911274819.6 | 申请日: | 2019-12-12 |
公开(公告)号: | CN112988433A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 陈涛;刘冰 | 申请(专利权)人: | 伊姆西IP控股有限责任公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 丁君军 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 故障 管理 方法 设备 计算机 程序 产品 | ||
本公开的实施例涉及一种用于故障管理的方法、设备和计算机程序产品。方法包括获得加速器资源中的加速器设备的使用率,其中加速器资源包括一个或多个加速器设备。方法还包括基于加速器设备的使用率,调整用于检测加速器设备中的故障的检测参数,然后根据检测参数来执行针对加速器设备的故障检测。本公开的实施例提出了基于工作负载感知的检测参数调整方案,能够根据加速器设备的当前使用情况,适应性地调整检测参数(例如超时值、频率等),由此实现更高效且更准确的故障检测。此外,本公开的一些实施例还能够通过故障恢复对象的决策和故障转移目标的选择,提高系统的性能和可靠性。
技术领域
本公开的实施例总体上涉及计算机技术领域,并且更具体地涉及用于故障管理的方法、设备以及计算机程序产品。
背景技术
加速器资源是指一些具有加速功能的处理资源,例如协处理器,其能够辅助中央处理器(CPU)执行一些加速任务。协处理器是一种芯片,其能够减轻系统CPU的特定处理任务。例如,数学协处理器可以进行数字处理,图形协处理器(GPU)可以处理视频绘制。GPU是一种专用于图形或图像的核心处理器,其主要负责的任务是加速图形处理速度。
快速辅助技术(QAT)卡也是一种协处理器,其可以用于加速计算密集型任务,例如压缩和加密等。通过为系统添加QAT卡,能够加快应用程序的运行,提高系统的性能和效率。QAT卡提供的功能可以包括对称加密、身份验证、不对称加密、数字签名、公开密钥加密、无损数据压缩,等等。
发明内容
本公开的实施例提供了一种用于故障管理的方法、设备和计算机程序产品。
在本公开的一个方面,提供了一种用于故障管理的方法。该方法包括:获得加速器资源中的加速器设备的使用率,其中加速器资源包括一个或多个加速器设备;基于加速器设备的使用率,调整用于检测加速器设备中的故障的检测参数;以及基于检测参数,执行针对加速器设备的故障检测。
在本公开的另一方面,提供了一种电子设备。该设备包括处理单元以及存储器,其中存储器被耦合至处理单元并且存储有指令。所述指令在由处理单元执行时执行以下动作:获得加速器资源中的加速器设备的使用率,其中加速器资源包括一个或多个加速器设备;基于加速器设备的使用率,调整用于检测加速器设备中的故障的检测参数;以及基于检测参数,执行针对加速器设备的故障检测。
在本公开的又一方面,提供了一种计算机程序产品。该计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括计算机可执行指令,所述计算机可执行指令在被执行时使得计算机执行根据本公开的实施例的方法或过程。
提供发明内容部分是为了简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。本发明内容部分无意标识本公开的关键特征或主要特征,也无意限制本公开的各个实施例的范围。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中在本公开示例性实施例中,相同的附图标记通常代表相同的元素。
图1示出了本公开的实施例的示例计算系统的一部分的架构的示意图;
图2示出了根据本公开的实施例的用于故障检测的方法的流程图;
图3示出了根据本公开的实施例的用于故障管理的方法的流程图;
图4示出了根据本公开的故障检测系统的框架的示意图;
图5示出了根据本公开的加速器资源中的拓扑结构的示意图;以及
图6示出了可以用来实施本公开的实施例的设备的示意性块图。
具体实施例
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西IP控股有限责任公司,未经伊姆西IP控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911274819.6/2.html,转载请声明来源钻瓜专利网。