[发明专利]一种基于免线缆的集群健康状态检测方法有效
申请号: | 202011299060.X | 申请日: | 2020-11-19 |
公开(公告)号: | CN112486761B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 郭长伟 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/34 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 张营磊 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 线缆 集群 健康 状态 检测 方法 | ||
本发明提供一种基于免线缆的集群健康状态检测方法,步骤如下:在存储集群内存储节点设置无线通信模块;每个存储节点内主控制器获取并统计各子控制器健康状态检测数据及公共健康状态检测数据,得到存储节点的健康状态检测数据;存储集群内各存储节点间主控制器通过无线通信模块,周期性互发各存储节点的健康状态检测数据;根据各存储节点的健康状态检测数据统计存储集群内控制器故障、控制器异常以及FRU模块运行状态异常,并通过将故障控制器从存储集群移除、降低异常控制器业务压力以及降低异常的FRU模块所在存储节点的业务压力,直至故障控制器、异常控制器以及FRU模块运行状态恢复正常。
技术领域
本发明属于存储集群检测检查技术领域,具体涉及一种基于免线缆的集群健康状态检测方法。
背景技术
FRU,是Field Replace Unit的简称,现场可更换单元。
通常情况下,存储产品通过ScaleOut横向扩展组网方式,来扩展存储集群控制器节点的个数,以提高存储集群的可靠性。高可靠性存储产品能够允许存储集群在多个控制器节点同时失效的情况下,保持业务不中断。即常说的“四坏三”、“八坏七”。为了保证存储集群能够及时的识别到某个或者某些控制器节点异常,集群所有节点间会有健康状态检测机制。通过健康状态检测机,集群在监测到某个或者某些控制器节点存在异常时,会及时的将异常节点的业务转移到正常节点上运行,保证整个集群业务的不中断。
健康状态检测需要每一个控制器节点到集群其它节点都有物理连接,现有的连接方式通常有两种:
共用集群节点间的ScaleOut横向扩展组网:该方式下,为了保证健康状态检测的可靠性,一般会预留5%-20%、最高优先级的链路带宽能力,从而降低了整个集群的业务能力。
专用的网络通道:该方式下,会极大的提高集群组网的复杂性,如四节点集群需要六条连线,八节点集群需要二十八条连线。
另外,现有健康状态检测机制,是以控制器为单位的,对于环境温度,接口卡状态等公共检测数据会存在冗余搜集现象。
此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种基于免线缆的集群健康状态检测方法,是非常有必要的。
发明内容
针对现有技术的上述现有存储集群健康状态检测方式中,横向扩展组网方式占用集群存储业务链路,降低业务处理能力;以及专用健康状态检查网络通道增加集群组网复杂性的缺陷,本发明提供一种基于免线缆的集群健康状态检测方法,以解决上述技术问题。
本发明提供一种基于免线缆的集群健康状态检测方法,包括如下步骤:
S1.在存储集群内每个存储节点设置无线通信模块;
S2.每个存储节点内主控制器获取并统计各子控制器健康状态检测数据及公共健康状态检测数据,得到本存储节点的健康状态检测数据;所述公共健康状态检测数据包括公共FRU模块运行状态;
S3.存储集群内各存储节点间主控制器通过无线通信模块,周期性互发各存储节点的健康状态检测数据;
S4.根据各存储节点的健康状态检测数据统计存储集群内控制器故障、控制器异常以及公共FRU模块运行状态异常;
将故障控制器移除存储集群,直至该故障控制器恢复再重新接入存储集群;
降低异常控制器业务压力,直至该异常控制器恢复正常;
降低运行状态异常的公共FRU模块所在存储节点的业务压力,直至该存储节点的公共FRU模块运行状态恢复正常。
进一步地,步骤S1具体步骤如下:
S11.设计若干基于USB接口的无线通信模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011299060.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电缆用散热装置
- 下一篇:一种服务资源处理方法及系统、代理设备、请求设备