[发明专利]服务节点自隔离方法及系统在审
申请号: | 202111575411.X | 申请日: | 2021-12-21 |
公开(公告)号: | CN114257496A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 邓志丹;顾亮;赵于凡;梁艳 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | H04L41/0659 | 分类号: | H04L41/0659;H04L41/0663;H04L41/0677 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 张琛 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务 节点 隔离 方法 系统 | ||
本公开提供了一种服务节点自隔离方法,可以应用于云计算技术领域。该方法包括:定时获取服务节点的当前运维数据;根据所述当前运维数据确定故障节点;根据故障节点类型确定故障节点信息;根据所述故障节点信息和预设节点配置信息确定隔离策略;以及根据所述隔离策略对所述服务节点进行隔离。本公开还提供了一种服务节点自隔离系统、设备、存储介质和程序产品。
技术领域
本公开涉及云计算领域,具体涉及分布式服务节点的自动运维技术,更具体地涉及一种服务节点自隔离方法、系统、设备、介质和程序产品。
背景技术
在分布式框架中,当某一节点发生故障时需对该故障节点进行隔离,即不再向该节点分配流量。一般对节点的隔离方式有两种:一种是负载均衡设备定期检查下挂节点并自动移除故障节点;另一种是通过监控报警系统发现故障节点,运维人员手动进行节点下线。
上述故障节点的隔离方法存在自动化程度低,覆盖场景不全,故障响应时间较长的问题;并且由于无法事前发现有宕机风险的节点,因此无法在节点宕机前进行流量转移,导致用户业务受影响,降低用户使用体验。
发明内容
鉴于上述问题,本公开提供了一种服务节点自隔离方法、装置、设备、介质和程序产品。
根据本公开的第一个方面,提供了一种服务节点自隔离方法,包括:定时获取服务节点的当前运维数据;
根据所述当前运维数据确定故障节点;
根据故障节点类型确定故障节点信息;
根据所述故障节点信息和预设节点配置信息确定隔离策略;以及
根据所述隔离策略对所述服务节点进行隔离。
根据本公开的实施例,所述当前运维数据包括磁盘使用率和数据库节点探活脚本查询值,所述根据所述当前运维数据确定故障节点包括:
若所述磁盘使用率大于第一阈值且数据库节点探活脚本查询值不为空或报错,则确定故障节点为服务节点;
若数据库节点探活脚本查询值为空或报错,则确定故障节点为数据库节点和所述数据库节点对应的服务节点。
根据本公开的实施例,所述当前运维数据还包括JVM堆内存占用量、CPU使用率和内存使用率,所述根据所述当前运维数据确定故障节点还包括:
根据三西格玛算法、历史运维数据和所述当前运维数据确定故障节点。
根据本公开的实施例,所述根据三西格玛算法、历史运维数据和所述当前运维数据确定故障节点包括:
根据历史运维数据和三西格玛算法确定第二阈值和第三阈值;
若当前运维数据大于第三阈值或小于第二阈值,则确定故障节点为服务节点。
根据本公开的实施例,所述根据故障节点类型确定故障节点信息包括:
当确定所述故障节点为服务节点时,获取所述服务节点名称、IP地址和异常指标信息;
当确定所述故障节点为数据库节点时,获取数据库节点名称。
根据本公开的实施例,所述预设节点配置信息包括服务节点与web节点的配置信息、软负载均衡与web节点的配置信息和服务节点与数据库节点的配置信息,所述根据所述故障节点信息和预设节点配置信息确定隔离策略包括:
根据服务节点与web节点的配置信息确定与所述服务节点对应的web节点以及根据软负载均衡与web节点的配置信息确定与web节点的对应的软负载均衡;
当确定web节点与所述服务节点为一对一关系时,获取软负载均衡下的其他web节点,将所述服务节点流量转发至所述其他web节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111575411.X/2.html,转载请声明来源钻瓜专利网。