[发明专利]对微服务故障转移的管理在审
申请号: | 202211452847.4 | 申请日: | 2022-11-21 |
公开(公告)号: | CN116340032A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 拉杰什·普纳昌德兰;马科斯·卡兰扎;克什蒂·阿伦·多西;弗朗西斯·桂姆·伯纳特;卡尔蒂克·库马尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 朱亦林 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微服 故障 转移 管理 | ||
1.一种系统,包括:
一个或多个处理资源;以及
机器可读介质,耦合到所述处理资源并且具有存储在其中的指令,所述指令在由所述处理资源执行时,使得所述处理资源执行以下操作:
响应于与如下平台的处理资源相关联的不可校正硬件错误来接收故障转移触发:主要微服务正在所述平台上执行服务的任务;
识别与所述主要微服务一起以锁步模式操作的次要微服务;
基于由所述主要微服务持久保存的故障转移元数据,引导所述次要微服务以非锁步模式来接管所述任务的执行;以及
使所述主要微服务脱机。
2.根据权利要求1所述的系统,还包括:评估器和用于所述服务的控制器,其中,所述控制器能够操作以执行与耦合到所述系统的XPU的可用性有关的发现以供所述服务的实例使用,并且其中,所述评估器能够操作以基于由所述评估器收集的、与所述服务的性能有关的遥测数据向所述控制器提供反馈。
3.根据权利要求2所述的系统,其中,所述反馈包括基于机器学习的激励函数。
4.根据权利要求2或3所述的系统,其中,所述一个或多个处理资源中的处理资源为所述控制器和所述评估器提供可信执行环境(TEE)。
5.一种方法,包括:
由故障转移服务响应于与如下平台的处理资源相关联的不可校正硬件错误来接收故障转移触发:主要微服务正在所述平台上执行服务的任务;
由所述故障转移服务识别与所述主要微服务一起以锁步模式操作的次要微服务;
由所述故障转移服务基于由所述主要微服务持久保存的故障转移元数据,使得所述次要微服务以非锁步模式来接管所述任务的执行;以及
由所述故障转移服务使得所述主要微服务脱机。
6.根据权利要求5所述的方法,其中,所述次要微服务正在与所述主要微服务不同的平台的第二处理资源上运行,并且其中,由所述故障转移服务使得所述次要微服务来接管所述任务的执行包括:经由所述平台的基板管理控制器(BMC)来间接地引导所述次要微服务。
7.根据权利要求5所述的方法,其中,所述次要微服务正在所述平台的第二处理资源上运行,并且其中,由所述故障转移服务使得所述次要微服务来接管所述任务的执行包括:与所述次要微服务的边车进行通信。
8.根据权利要求5至7中任一项所述的方法,其中,所述故障转移触发是响应于所述故障转移服务正在其上运行的访客OS被通知由虚拟机管理器(VMM)接收到中断,而从所述访客OS接收的。
9.根据权利要求8所述的方法,其中,所述中断包括由所述处理资源响应于所述不可校正硬件错误而生成的不可屏蔽中断(NMI)。
10.根据权利要求9所述的方法,其中,所述NMI包括机器检查异常。
11.根据权利要求10所述的方法,还包括:响应于所述平台的BMC接收到所述NMI,由所述BMC采取基于策略的动作。
12.根据权利要求11所述的方法,其中,所述基于策略的动作包括向提供所述服务的数据中心的机队管理模块发出警报。
13.一种非暂态机器可读介质,存储有指令,所述指令在由处理器执行时,使得所述处理器执行如权利要求5至12中任一项所述的方法。
14.一种计算机程序,包括指令,当所述程序由处理器执行时,所述指令使得所述处理器执行如权利要求5至12中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211452847.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:渔线轮卡座
- 下一篇:颜色转换方法、装置、电子设备及存储介质