[发明专利]一种实现Insight管理平台故障自恢复的方法及装置在审
申请号: | 202010453981.0 | 申请日: | 2020-05-26 |
公开(公告)号: | CN111737045A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 道玉明 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 李修杰 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 insight 管理 平台 故障 恢复 方法 装置 | ||
1.一种实现Insight管理平台故障自恢复的方法,其特征在于,所述的方法包括:
S1:检测到原主节点故障后,触发主节点选举机制;
S2:将采用选举机制选出的最优节点升级为新的主节点;
S3:从AEP内存中获取原主节点的数据配置并导入新的主节点;
S4:验证新的主节点能否正常工作,若能,则完成恢复,若不能,则发送报警信息。
2.根据权利要求1所述的一种实现Insight管理平台故障自恢复的方法,其特征在于,所述的方法还包括:
S5:运维人员调用切换模块,将集群中一个节点升级为主节点。
3.根据权利要求1所述的一种实现Insight管理平台故障自恢复的方法,其特征在于,步骤S4中,若新的主节点不能正常工作,在向运维人员发送报警信息的同时,记录新的主节点为故障节点,并返回步骤S1重新选举。
4.根据权利要求1所述的一种实现Insight管理平台故障自恢复的方法,其特征在于,步骤S1中,触发的主节点选举机制为:
通过获取集群各剩余节点的I/O能力、Job任务执行在线数量、CPU参数、存储参数、内存参数、网络参数、电源参数,按照设定的权重比例计算各个节点的得分,得分最高的节点为最优节点。
5.根据权利要求4所述的一种实现Insight管理平台故障自恢复的方法,其特征在于,设定的权重比例为:
I/O能力、Job任务执行在线数量、CPU参数、存储参数、内存参数、网络参数、电源参数之间的权重比例为2:1:2:1:2:1:1。
6.根据权利要求1所述的一种实现Insight管理平台故障自恢复的方法,其特征在于,步骤S2的具体实现方法为:
将最优节点设定为主节点,并开启最优节点的agent及管理平台界面。
7.根据权利要求1所述的一种实现Insight管理平台故障自恢复的方法,其特征在于,步骤S3中,原主节点的数据配置包括:log日志告警信息及监控信息。
8.一种实现Insight管理平台故障自恢复的装置,其特征在于,所述的装置设置在集群的主节点,且集群中任一节点均存在agent,所述的装置包括:
选举模块,基于主节点故障来触发,用于通过采集集群各剩余节点的I/O能力、Job任务执行在线数量、CPU参数、存储参数、内存参数、网络参数、电源参数,计算得分最高的节点为最优节点;
内存模块,用于从AEP内存中获取原主节点的数据配置并导入新的主节点;
验证模块,用于验证新的主节点能否正常工作,若能,则完成恢复,若不能,则发送报警信息。
9.根据权利要求8所述的一种实现Insight管理平台故障自恢复的装置,其特征在于,所述的装置还包括:
一键切换模块,用于手动切换节点。
10.根据权利要求8所述的一种实现Insight管理平台故障自恢复的装置,其特征在于,若新的主节点不能正常工作时,所述的验证模块还用于记录新的主节点为故障节点,并触发选举模块再次工作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010453981.0/1.html,转载请声明来源钻瓜专利网。