[发明专利]分布式作业系统控制方法、装置、设备、介质及程序产品在审
申请号: | 202111602689.1 | 申请日: | 2021-12-24 |
公开(公告)号: | CN114416284A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 王帅俭;黎世勇;张恒华;李盼盼;胡在斌;骆宝童 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F9/455 | 分类号: | G06F9/455;G06F11/07;G06F11/14 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李英艳;杨继成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 作业 系统 控制 方法 装置 设备 介质 程序 产品 | ||
1.一种分布式作业系统控制方法,所述方法包括:
针对承载第一进程的第一容器,响应于检测到所述第一进程基于所述第一容器发生故障被触发进程终止,确定所述第一容器发生故障的当前故障类型;
若所述当前故障类型与目标故障类型一致,则重建所述第一容器,并基于重建后的第一容器,重启所述第一进程;
其中,所述目标故障类型为适用于所述第一容器所属分布式作业系统中各容器重建的故障类型。
2.根据权利要求1所述的方法,其中,所述目标故障类型通过第一标识表征;
所述当前故障类型与目标故障类型一致,采用如下方式确定:
获取表征所述当前故障类型的第二标识;
确定所述第一标识与所述第二标识匹配。
3.根据权利要求2所述的方法,其中,所述第一标识包括所述第一容器发生目标故障类型的故障时,由所述第一容器生成的第一退出码;
所述获取表征所述当前故障类型的第二标识,包括:
获取所述第一容器基于所述当前故障类型生成的第二退出码;
确定所述第一标识与所述第二标识匹配,包括:
确定所述第一退出码与所述第二退出码匹配。
4.根据权利要求1至3中任意一项所述的方法,重建所述第一容器之前,还包括:
获取容器重建信息,所述容器重建信息用于指示在容器发生故障时的待重建容器,并基于所述容器重建信息确定所述待重建容器包括所述第一容器。
5.根据权利要求4所述的方法,还包括:
若基于所述容器重建信息确定所述待重建容器包括第二容器,则重建所述第二容器,并基于重建的第二容器重启所述第二容器所承载的第二进程;
所述第二容器为以下至少一种容器:
所述第一容器所属副本集中的容器;
与所述第一容器所属副本集具有关联关系的副本集中的容器;
所述第一容器所属作业中的容器。
6.一种分布式作业系统控制装置,所述装置包括:
检测模块,用于针对承载第一进程的第一容器,检测所述第一进程基于所述第一容器发生故障被触发进程终止;
确定模块,响应于检测到所述第一进程基于所述第一容器发生故障被触发进程终止,确定所述第一容器发生故障的当前故障类型;
处理模块,用于在所述当前故障类型与目标故障类型一致的情况下,重建所述第一容器,并基于重建后的第一容器,重启所述第一进程;其中,所述目标故障类型为适用于所述第一容器所属分布式作业系统中各容器重建的故障类型。
7.根据权利要求6所述的装置,其中,所述目标故障类型通过第一标识表征;
所述确定模块采用如下方式确定所述当前故障类型与目标故障类型一致:
获取表征所述当前故障类型的第二标识;
确定所述第一标识与所述第二标识匹配。
8.根据权利要求7所述的装置,其中,所述第一标识包括所述第一容器发生目标故障类型的故障时,由所述第一容器生成的第一退出码;
所述确定模块采用如下方式获取表征所述当前故障类型的第二标识:
获取所述第一容器基于所述当前故障类型生成的第二退出码;
所述确定模块采用如下方式确定所述第一标识与所述第二标识匹配:
确定所述第一退出码与所述第二退出码匹配。
9.根据权利要求6至8中任意一项所述的装置,所述确定模块,还用于:
在重建所述第一容器之前,获取容器重建信息,所述容器重建信息用于指示在容器发生故障时的待重建容器,并基于所述容器重建信息确定所述待重建容器包括所述第一容器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111602689.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动贴墙砖装置
- 下一篇:用于检测MJS加固质量的多维瞬态击发式智能装置