[发明专利]一种网络故障根源诊断的方法和装置有效
申请号: | 201410025248.3 | 申请日: | 2014-01-20 |
公开(公告)号: | CN104796273B | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 郭炜 | 申请(专利权)人: | 中国移动通信集团山西有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张颖玲;王黎延 |
地址: | 030032 山西*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络故障 根源 诊断 方法 装置 | ||
本发明公开了一种网络故障根源诊断的方法,包括:根据网络的拓扑结构建立网络设备之间的拓扑关系;检测网络设备故障,当检测到网络故障告警时,分别计算网络拓扑中每个节点为根源故障节点的概率;确定根源故障节点概率最大的节点,输出分析结果。本发明同时还公开了一种网络故障根源诊断的装置,采用本发明,能够有有效提高网络故障根源分析的效率和准确性。
技术领域
本发明涉及网络管理安全技术领域,尤其涉及一种网络故障根源诊断的方法和装置。
背景技术
随着业务发展对IT系统要求的不断提高,现有网络设备间的关系变得越来越复杂。在如此多的相互依存的系统、流程和服务来支撑业务运营的过程中,进行全面且持续的对网络系统监控至关重要。为了能够完整的、实时的、直观的查看不断变化的网络基础设施,需要部署网络管理装置来监控网络中的所有网元设备。但是,当出现网络故障时,传统的网络管理装置会为每台受影响的设备产生大量的故障告警信息,海量的故障告警信息会降低运维人员排查故障的效率,特别是在网元设备较多的网络环境中,传统网管装置的监控告警功能让网络管理员需要花费大量的时间去进行人工的告警关联及分析,严重影响了网络维护人员排查根源故障的效率。
目前,现有的对网络故障根源诊断的方法中,大多采用定期轮询或异步通知的方式搜集网络中所有网元设备的网络事件,搜集到的事件存储于事件数据库中,这些事件由故障根源分析引擎根据网络拓扑信息以及拓扑事件进行关联,故障根源分析引擎识别、关联并压缩相互关联的事件,仅将故障根源发送给网络管理员以采取对应的解决方案。
但是,现有的网络故障根源诊断方案存在如下缺陷:现有的网管软件中的故障根源诊断引擎只对事件数据库中的事件进行分析和关联,以试图寻找出网络故障的根源;那么,当进行网络故障根源分析时,如果事件数据库中的历史事件不足以支持进行完整分析时,网络管理员将得不到故障根源分析的结果。
此外,现有的网络故障根源诊断的方案中,将各种网元设备均简单地视为网络节点,没能体现出主机设备、网络交换机、路由器等设备在网络系统中的特性和区别;进行网络故障根源分析时,所需要计算的内容较多,需要消耗的资源较高,且结果准确率不高。
发明内容
有鉴于此,本发明实施例期望提供一种网络故障根源诊断的方法和装置,能够有效提高网络故障根源分析的效率和准确性。
为达到上述目的,本发明的技术方案是这样实现的:
本发明实施例一种网络故障根源诊断的方法,所述方法包括:
根据网络的拓扑结构建立网络设备之间的拓扑关系;
检测网络设备故障,当检测到网络故障告警时,分别计算网络拓扑中每个节点为根源故障节点的概率;
确定根源故障节点概率最大的节点,输出分析结果。
上述方案中,所述网络设备之间的拓扑关系包括网络设备之间的连接关系和上下游关系;
其中,网络设备之间的连接关系由网络自动扫描建立,网络设备之间的上下游关系根据设备类型及辅助输入决定。
上述方案中,所述分别计算网络拓扑中每个节点为根源故障节点的概率包括:分别计算每个节点的根源故障计算概率与加权后的根源故障历史事件分析概率的和。
上述方案中,所述计算节点的根源故障计算概率包括:
计算节点本身硬件故障导致的本节点的根源故障计算概率;
依次计算本节点与相连的所有下级节点之间故障的对应的根源故障计算概率、本节点与相连的所有平级节点之间故障的对应的根源故障计算概率、本节点与相连的所有上级节点之间故障的对应的根源故障计算概率;
计算节点本身硬件故障导致的本节点的根源故障计算概率与本节点与相连的所有节点之间故障的对应的根源故障计算概率的和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团山西有限公司,未经中国移动通信集团山西有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410025248.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:软件定义网络中的中间盒调度方法及系统
- 下一篇:网络时钟的监测方法与装置