[发明专利]一种故障关系生成及故障确定方法及装置有效
申请号: | 201010597571.X | 申请日: | 2010-12-20 |
公开(公告)号: | CN102546205A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 张志宏;孙少陵;周伟;赵鹏;罗治国 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 故障 关系 生成 确定 方法 装置 | ||
技术领域
本发明涉及业务支撑技术领域,尤其涉及一种故障关系生成及故障确定方法及装置。
背景技术
云计算系统是利用大规模低成本运算单元通过复杂的IP网络相连所组成的,提供运算服务的运算系统。图1为现有云计算系统的垂直分层结构示意图,云计算系统由底层向高层依次包括:网络层、物理服务器层、操作系统层、云计算平台层以及云计算应用层。
云计算系统规模庞大,通常包括上千个服务器节点,并且云计算系统的底层为性能较差的商业服务器节点,其故障率较高。同时云计算系统以分布式计算模型为主,即一个应用包含多个服务器之间的网络交互和协同工作,因此当云计算系统中某一服务器节点出现故障时,与其相关的服务器节点的相应部件也要受到影响出现故障。并且对于云计算系统由于其各个层次之间也存在依赖关系,不同层次之间的服务器节点的故障也会相互影响。因此如何在云计算系统中确定故障的根源成为一个比较棘手的问题。另外,对于其他结构比较复杂的系统,在进行定位时也存在与云计算系统相同的问题。
现有技术在确定故障的根源时,可以基于网络设备之间的物理连接关系,其主要过程包括:对各个网络设备的故障进行轮询,根据轮询的结果,将相互之间存在物理连接关系的网络设备所在的区域称为故障区域,在确定的故障区域内,根据每个故障的网络设备与其他网络设备之间的物理连接关系,确定该故障区域内的故障根源。
上述确定故障的方法中,基于网络设备之间的物理连接关系确定,该方法只能解决通信设备层面的问题,而对于结构比较复杂的系统,例如云计算系统由于其包括上千个服务器节点,连接关系非常复杂,并且位于不同层面的服务器之间也是相互关联的。因此可知对于系统中这种在不同服务器节点之间,以及同一服务器节点的不同层面之间都具有复杂的相关性,因此基于上述网络设备确定故障的方法无法应用到该系统中。
另外,在现有技术中还可以确定软件中的故障,具体包括:根据链接时的优化器,获取静态控制依赖信息,并根据动态插装可执行程序,搜集动态执行轨迹信息;解析搜集到的轨迹信息,得到动态依赖关系;再根据保存的动态依赖关系的可疑度公式,计算得到的每个动态依赖关系的可疑度;然后将可疑度的值映射到程序的可执行语句上,并将各语句按照可疑度的大小进行降序排列,输出软件故障定位的报告。
上述确定软件中的故障的方法,由于其只能用于对软件进行故障定位,也就是说只能用于对单个软件内部进行故障的定位,因此无法适用于确定整个系统中的故障。
发明内容
有鉴于此,本发明实施例提供一种故障关系生成及故障确定方法及装置,用以解决无法在系统中进行故障定位的问题。
本发明实施例提供的一种故障关系生成方法,包括:
根据该报警事件发生的时间,该报警事件中携带的故障类型信息,以及保存的故障类型信息与时间范围信息的对应关系,确定该报警事件对应的故障的有效期信息;并
根据确定的有效期信息,确定发生时间处于该有效期内的其他报警事件;
将每个报警事件作为故障关系中的节点,分别连接该报警事件对应的节点到确定的其他报警事件对应的节点的路径。
本发明实施例提供的一种基于上述生成的故障关系进行故障确定的方法,包括:
根据用户输入的报警事件,在生成的故障关系中查找对应该输入的报警事件的节点;
根据查找到的节点,逆向路径查找到达该节点的每条路径,根据每条路径上的节点对应的报警事件进行故障定位。
本发明实施例提供的一种基于上述生成的故障关系确定报警事件的扩散范围的方法,包括:
根据用户输入的报警事件,在生成的故障关系中查找对应该输入的报警事件的节点;
根据查找到的节点,顺次查找以该节点为起点的每条路径,根据每条路径上的节点对应的报警事件,确定该报警事件的扩散范围。
本发明实施例提供的一种云计算系统中故障关系生成装置,包括:
第一确定模块,用于根据报警事件发生的时间,该报警事件中携带的故障类型信息,以及保存的故障类型信息与时间范围信息的对应关系,确定该报警事件对应的故障的有效期信息,并根据确定的有效期信息,确定发生时间在该有效期内的其他报警事件;
生成模块,用于将每个报警事件作为故障关系中的节点,分别连接该报警事件对应的节点到确定的其他报警事件对应的节点的路径。
本发明实施例提供的一种基于上述生成装置的故障确定装置,包括:
第一查找模块,用于根据用户输入的报警事件,在生成的故障关系中查找对应该输入的报警事件的节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010597571.X/2.html,转载请声明来源钻瓜专利网。