[发明专利]一种网络故障检测方法及装置有效
申请号: | 201911286017.7 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111064613B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 李韧 | 申请(专利权)人: | 新华三大数据技术有限公司 |
主分类号: | H04L43/0852 | 分类号: | H04L43/0852;H04L41/0631;H04L41/0659 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孟维娜;李欣 |
地址: | 450000 河南省郑州市高新技*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络故障 检测 方法 装置 | ||
本申请实施例提供了一种网络故障检测方法及装置,应用于业务集群内第一业务节点中的第一设备,包括:针对各待测链路计算表征统计周期内通过该待测链路所发送消息的消息时延作为链路时延,待测链路为与第一业务节点不同的待测业务节点中各个第二设备与第一设备间的链路,消息时延为向第二设备发送消息至接收到第二设备反馈响应间的时延;针对每一第二设备根据一端为该第二设备的待测链路的链路时延,计算表征统计周期内向该第二设备所发送消息的消息时延作为综合消息时延;根据待测业务节点中综合消息时延超过预设时延的第二设备的数量,检测待测业务节点是否存在网络故障。应用本申请实施例提供的方案能提高对业务节点进行网络故障检测的准确度。
技术领域
本申请涉及网络技术领域,特别是涉及一种网络故障检测方法及装置。
背景技术
随着用户量增加、用户需求增长,通常基于包含多个业务节点的业务集群向用户提供业务。例如,上述业务集群可以是用于提供存储业务的存储集群等。其中,上述业务节点中可以包含多个用于提供业务的设备。
然而受网络超时、网络连接闪断、网络状态震荡、数据丢包等因素的影响,上述业务集群可能会工作在亚健康的网络环境下,导致业务集群内各个业务节点出现网络故障,工作状态不稳定,例如,出现业务节点所提供的业务震荡、业务归零、业务节点内设备频繁报错等现象。严重的情况下,甚至可能会导致业务集群长时间不可用。为此需要对业务集群中各个业务节点进行网络故障检测。
以上述业务集群为基于Ceph存储架构的存储集群为例,上述业务节点为存储节点。每一存储节点中同一PG(Placement Groups,放置组)内的OSD(Object Store Device,对象存储设备)通过互发心跳包的方式检测对端OSD是否存在网络故障。假设,OSD1向OSD2发送Ping心跳包后,若20秒内没有接收到OSD2反馈的心跳回复,则认为OSD2存在网络故障。但是这种情况下,OSD1仅仅认为OSD2这单一一个OSD存在网络故障,不会认为整个业务节点存在网络故障,后续进行OSD隔离时,也仅仅隔离OSD2这一个OSD。所以,站在检测存储节点是否存在网络故障的角度来讲,应用上述方式进行网络故障检测准确率低。
另外,这种情况下,OSD2所属的存储节点中还可能存在其他有网络故障的OSD,但是上述存储节点依然正常提供存储业务,可能会导致整个存储集群存在业务震荡,难以保证存储集群提供连续的存储业务。
发明内容
本申请实施例的目的在于提供一种网络故障检测方法及装置,以提高对业务节点进行网络故障检测的准确度。具体技术方案如下:
第一方面,本申请实施例提供了一种网络故障检测方法,应用于业务集群内第一业务节点中的第一设备,所述方法包括:
针对每一待测链路,计算表征统计周期内通过该待测链路所发送消息的消息时延,作为该待测链路的链路时延,其中,所述待测链路为:与所述第一业务节点不同的待测业务节点中各个第二设备与所述第一设备间的链路,所述消息时延为:向第二设备发送消息至接收到第二设备反馈响应间的时延;
针对每一第二设备,根据一端为该第二设备的待测链路的链路时延,计算表征所述统计周期内向该第二设备所发送消息的消息时延,作为该第二设备的综合消息时延;
根据所述待测业务节点中综合消息时延超过预设时延的第二设备的数量,检测所述待测业务节点是否存在网络故障。
本申请的一个实施例中,所述针对每一待测链路,计算表征统计周期内通过该待测链路所发送消息的消息时延,作为该待测链路的链路时延,包括:
针对每一待测链路,获得统计周期内通过该待测链路发送的每一消息的消息时延,计算所获得消息时延的平均值,作为该待测链路的链路时延。
本申请的一个实施例中,所述每一消息的消息时延为:T2-T1-ΔT;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三大数据技术有限公司,未经新华三大数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911286017.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:漏磁检测探头姿态补偿方法及装置
- 下一篇:图像分析方法、装置及电子设备