[发明专利]计算系统中延期的服务器恢复方法和设备有效
申请号: | 201680072913.1 | 申请日: | 2016-12-29 |
公开(公告)号: | CN108369544B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | N·艾伦;G·贾格蒂亚尼 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/14;G06F11/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 系统 延期 服务器 恢复 方法 设备 | ||
1.一种由计算系统中的计算设备执行的方法,所述计算系统具有由计算机网络互连的多个主机,所述方法包括:
从所述计算系统中的一个主机接收故障的通知,所述主机当前正在执行一个或多个计算任务以用于为用户提供计算服务;
响应于接收到所述通知,确定接收到的所述通知中的所述故障的恢复在所述主机上是否是可延期的,其中当所述主机尽管接收到所述通知中的所述故障但仍能够通过执行由所述主机当前正在执行的所述一个或多个计算任务而继续向所述用户提供所述计算服务时,所述故障的恢复是可延期的;以及
响应于确定接收到的所述通知中的所述故障是可延期的,
确定具有未决的恢复操作的主机的总数目是否超过阈值;以及
响应于具有未决的恢复操作的主机的所述总数目不超过所述阈值,
设置时间延迟,以便随后对所述主机执行恢复操作;以及
禁止向所述主机分配其他计算任务。
2.根据权利要求1所述的方法,还包括响应于确定接收到的所述通知中的所述故障是可延期的,向所述主机传送指令,以永久地存储与当前正在由所述主机执行的所述一个或多个计算任务有关的状态信息。
3.根据权利要求1所述的方法,还包括响应于确定接收到的所述通知中的所述故障不是可延期的,向所述主机传送指令,以用于立即对所述主机执行恢复操作。
4.根据权利要求1所述的方法,还包括在设置所述时间延迟之后,通知所述用户所述未决的恢复操作和所设置的所述时间延迟,从所述用户接收输入,并且当所设置的所述时间延迟未期满时,基于接收到的所述输入而发起所述主机的立即恢复。
5.根据权利要求1所述的方法,还包括:
确定以便随后对所述主机执行所述未决的恢复操作的所设置的所述时间延迟是否期满;以及
响应于确定所设置的所述时间延迟期满,向所述主机传送指令,以用于对所述主机执行所述未决的恢复操作。
6.根据权利要求1所述的方法,还包括:
监测所述主机当前正在执行的所述计算任务的数目;以及
响应于确定所述主机当前未执行任何计算任务,即使所设置的所述时间延迟未期满,也传送用于对所述主机执行所述未决的恢复操作的指令。
7.根据权利要求1所述的方法,还包括:
响应于确定接收到的所述通知中的所述故障是可延期的,
确定具有未决的恢复操作的主机的总数目是否超过阈值;以及
响应于具有未决的恢复操作的主机的所述总数目超过所述阈值,向所述主机传送指令以用于立即对所述主机执行恢复操作。
8.根据权利要求1所述的方法,还包括:
通过以下来确定所述阈值:
基于用户输入,利用静态值设置所述阈值,或者
基于所述计算系统的容量或使用率中的一项或多项,动态地计算所述阈值。
9.根据权利要求1所述的方法,其中:
所述故障的所述通知是第一故障的第一通知;
所述方法还包括:
从所述计算系统中的所述主机接收第二故障的第二通知、意外的停机时间事件的通知或者计划的维护事件;
确定所述第一故障的恢复与所述第二故障的恢复、所述意外的停机时间事件或者所述计划的维护事件是否是可组合的;以及
响应于确定所述第一故障的恢复与所述第二故障的恢复、所述意外的停机时间事件或者所述计划的维护事件是可组合的,连同所述第二故障的恢复、所述意外的停机时间事件或者所述计划的维护事件一起执行所述第一故障的恢复。
10.根据权利要求1所述的方法,其中设置所述时间延迟包括:将所述时间延迟设置为预定值,或者基于所述计算系统中的容量、使用率或虚拟机周转率中的一个或多个来计算所述时间延迟。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680072913.1/1.html,转载请声明来源钻瓜专利网。