[发明专利]一种网络故障探测与定位的方法有效
申请号: | 201110257071.6 | 申请日: | 2011-09-01 |
公开(公告)号: | CN102299829A | 公开(公告)日: | 2011-12-28 |
发明(设计)人: | 刘丰;陈纲;雷振;黄睿;纪烨;杜海;杜刚 | 申请(专利权)人: | 北京市天元网络技术股份有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L12/24 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100029 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络故障 探测 定位 方法 | ||
技术领域
本发明涉及计算机网络技术领域,特别涉及一种网络故障定位的方法。
背景技术
随着通信技术的高速发展,网络规模的不断扩大,网络复杂性的日益提高,为了提高服务质量和降低运行成本,对网络管理系统的要求越来越高。
其中,故障管理是网络管理中最基本的功能之一。网络的可靠性是实现网络系统功能的基础,而要保证网络的可靠运行,故障管理是必不可少的内容。故障管理的目的在于确保网络系统的高稳定性。在网络出现故障时,故障管理系统必须及时发现故障部位。故障管理的日常工作包含对所有节点动作状态的监控、故障记录的追踪与检查,以及平常对网络系统的测试。随着网络规模的不断扩大和网络复杂度的日益提高,故障管理的重要性和难度也日益加大。
而故障定位作为故障管理中的一个核心功能,在现今越来越复杂的网络中发挥着尤其重要的作用。为保障网络的正常运作,需要有效可靠的故障定位技术。但是由于网络中被管设备数量巨大、类型繁多、连接复杂,并且每个设备的告警事件都会上报给网管系统,所以当网络中发生故障时,由于告警数据庞大,运维人员无法快速定位故障源,从而影响故障的恢复和业务质量的保障。而且随着网络规模的不断扩大,各类业务量应用的加大,以及故障在不同协议层的出现,对故障定位的要求也越来越高。故障定位不仅仅要能定位协议栈底层的物理故障,同时也要能定位协议栈上层的各类应用业务故障。而网络的不确定性及网络中的观测噪声,也为故障定位技术提出了新的要求和挑战。
目前,从计算机科学的不同领域中派生出的多种多样的故障定位方法总的来说可以分为两类:被动收集信息的故障定位方法和主动探测的故障定位方法。采用被动收集信息故障定位方法的网管系统往往需要目标系统具备提供内部消息的能力,并且不可能在用户感知到故障前检测和定位故障。且被动收集信息的网管系统已经无法满足越来越复杂的网络的需要。现实的情况要求更好的模型,算法和系统来应付更复杂的集成网络,系统和服务。而基于主动探测的网管系统,使用主动探测的方式对被管设备进行探测并对探测结果进行分析。具有主动、高效及自适应的特性,能以很小的代价尽早地获得网络、系统故障、服务失败及性能衰退等症状,从而为根源故障的分析提供依据。
但是,主动探测的方式会为网络带来额外的配置开销及流量负载。首先,主动探测的方式要在网络中配置一定数目的探测站点以保证发出的探测能覆盖整个网络,并能有效地定位网络中发生的所有故障。而这样特殊节点的存在,就会引入对节点的配置和维护开销。所以如何设计一个高效且引入最小花销的探测站点选择算法就显得尤为重要了。此外,从选定的探测站点发出的探测也将给网络带来额外的流量负载。这就要求,选择探测的算法必须能对探测进行分析,找出最优的探测集合(探测数目最少且探测能力最强),使得由主动探测带给网络的流量负载最小。并且,探测的选择算法应该具有自适应的特点,即能根据已经发出的探测反馈的结果,来决定后续的探测选择,这样才能最大化的利用网络提供的信息来帮助探测的选择从而达到定位故障的目的。
专利文献CN101783749A中提供了一种网络故障定位方法和装置,通过将网络模拟成动态贝叶斯模型和进行概率推理来定位故障,但由于动态网络的复杂性,传播概率的不确定性和信度更新的时间复杂度,该发明的实时性较低。
专利文献CN101350739A中提供了一种IP网络中的故障定位方法,其采用了一种将症状集合对应于相应的故障集合的算法。但该算法仅仅提出了一种假设性的推理,建立故障传播模型,并未与真实的网络进行交互性处理,因此准确度较低,在真实的网络中达不到算法的效果。
文献《Active Integrated Fault Localization in Communication Networks》(Yongning Tang等,Integrated Network Management,2005.IM 2005.2005 9th IFIP/IEEE International Symposium on Integrated Network Management)中公开了一种结合主动和被动两种技术优点的故障定位技术AIR,该技术虽然能达到相对较高的准确度和性能,但由于被动监听反应滞后的缺陷,严重影响该方法网络实时定位的性能,同时其方法对网络设备的要求较高。
发明内容
(一)要解决的技术问题
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市天元网络技术股份有限公司,未经北京市天元网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110257071.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种宽频信号波峰削除方法及装置
- 下一篇:一种盾构机刀盘驱动系统控制装置