[发明专利]故障定位方法和网络设备有效
申请号: | 201611138835.9 | 申请日: | 2016-12-12 |
公开(公告)号: | CN108616367B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 薛莉;谢于明;张亮;吴俊;丁律 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 张欣;王君 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 故障 定位 方法 网络设备 | ||
本发明实施例提供了一种故障定位方法和网络设备,该方法包括:第一网络设备接收网络中除第一网络设之外的其他网络设备以泛洪方式发送的故障信息报文,每个故障信息报文包括发送所述故障信息报文的网络设备关于内部网关协议的报文的统计信息,每个网络设备的统计信息包括所述网络设备对一个或多个关键性能指标KPI的统计结果;根据第一网络设备的统计信息以及其他网络设备的统计信息,确定所述网络中发生故障的网络设备。本发明实施例通过接收网络设备以泛洪方式发送的故障信息报文,能够快速收集故障定位所需的信息,即网络设备的KPI,从而加速了故障定位的过程,缩短了故障定位时间。
技术领域
本发明实施例涉及通信领域,并且更具体的,涉及一种故障定位方法和网络设备。
背景技术
网络经常发生故障,当故障发生时,如果不及时定位出发生故障的网络设备或者链路并处理,该故障就可能扩散至整个网络,即发生网络震荡。网络震荡会引起全网瘫痪和业务中断。例如,假设某路由设备发生时钟故障,导致该路由设备的系统时间比网络中的其它路由设备的系统时间快数百倍,这样会引发整个网络的其他路由设备反复删除和生成该路由设备对应的表项,严重消耗了其他路由设备的资源,当其他路由设备的资源被耗尽时,会引发全网瘫痪和全网业务中断。
网络发生故障时,如何定位发生故障的网络设备是一个难题。以震荡类故障为例,震荡类故障的定位存在如下两个问题:
一是震荡类故障发生的时候,难以采集整个网络中的网络设备的故障信息,严重影响故障分析的进程。因为整个网络中,网络设备众多,部分网络设备不支持网管维护,部分网络设备不在网管部署的范围内,导致震荡类故障发生时,一般需要通过远程登陆服务标准协议(英文:Telnet)登陆到不同的网络设备上,分别收集登陆的网络设备的故障信息,例如,收集全网所有路由器的中央处理单元(英文:central processing unit,简称为“CPU”)的状态信息时,需要登陆到整个网络中的每个路由器,对每个路由器的CPU的状态信息分别进行采集,且该Telnet协议只能分组、串行登陆到不同网络设备上进行信息的采集。所以,在这种情况下,需要多台网络设备远程接入网络,且故障信息采集和定位的效率低。
二是在分析震荡类故障的时候,需要在众多的网络设备的海量信息中做人工排查,这种方式需要运维人员具有丰富的设备运营维护经验,且分析效率低下,导致故障持续的时间长,业务受影响面积大。
发明内容
本发明实施例提供一种故障定位方法和网络设备,能够对网络中发生故障的网络设备进行快速、准确的定位。
第一方面,提供一种故障定位的方法。第一网络设备接收除所述第一网络设备外的其他网络设备以泛洪方式发送的故障信息报文,每个故障信息报文包括发送所述故障信息报文的网络设备关于内部网关协议的报文的统计信息,每个网络设备的统计信息包括所述网络设备对一个或多个关键性能指标KPI的统计结果;所述第一网络设备根据所述第一网络设备的统计信息以及所述其他网络设备统计信息,确定所述网络中发生故障的网络设备。
通过接收网络设备以泛洪方式发送的故障信息报文,能够快速收集故障定位所需的信息,即网络设备的KPI,从而加速了故障定位的过程,缩短了故障定位时间。
结合第一方面,在第一方面的第一种实现方式中,所述第一网络设备获取所述第一网络设备的统计信息,所述统计信息包括所述第一网络设备的一个或多个KPI的统计结果;所述第一网络设备以泛洪方式向所述其他网络设备发送所述第一网络设备的故障信息报文,所述第一网络设备的故障信息报文包含所述第一网络设备的统计信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611138835.9/2.html,转载请声明来源钻瓜专利网。