[发明专利]故障分析方法及装置有效
申请号: | 201910288814.2 | 申请日: | 2019-04-11 |
公开(公告)号: | CN110187992B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 刘照星 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新;朱文杰 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 故障 分析 方法 装置 | ||
本说明书一个或多个实施例公开了一种故障分析方法及装置,用以实现快速定位系统的故障发生坐标,从而便于针对故障执行应急操作。所述方法包括:获取目标系统的日志信息;其中,所述目标系统包括多个服务接口;各所述服务接口分别对应各自的接口位置信息;根据所述日志信息,确定执行事件服务的多个第一服务接口;及,按照所述请求标识信息对多个所述第一服务接口进行聚类,得到至少一个服务接口集;从各所述服务接口集中筛选出事件执行结果为失败的第二服务接口;及,确定所述第二服务接口对应的接口位置信息为所述第二服务接口所在的服务接口集中的故障发生点。
技术领域
本说明书涉及通信技术领域,尤其涉及一种故障分析方法及装置。
背景技术
应用、技术组件或数据存储库等系统中,通常包含多个服务器实例、多个服务接口,且每个服务接口分布在不同的物理机房和逻辑机房。以微贷融资业务的支撑系统为例,微贷融资业务的支撑系统共有300多个,单系统存在多个服务器实例、多个服务接口,若以服务接口的物理坐标点统计,其数量大概在1万左右。
上述所述的系统中,若某一服务接口的坐标点发生故障,则必会发生连锁反应,导致应急报警、系统异常信息报警和业务下跌报警,所有报警事件加起来能达到10万量的级别。可见,如何快速地在各类报警事件中定位到异常坐标点,是一切处理措施(如异常原因分析、解决办法等)的开始。为了加强系统应急能力,需要有一套快速定位系统故障发生坐标点的方法。
发明内容
本说明书一个或多个实施例的目的是提供一种故障分析方法及装置,用以实现快速定位系统的故障发生坐标,从而便于针对故障执行应急操作。
为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
一方面,本说明书一个或多个实施例提供一种故障分析方法,包括:
获取目标系统的日志信息;其中,所述目标系统包括多个服务接口;各所述服务接口分别对应各自的接口位置信息;所述日志信息包括由所述目标系统根据接收到的请求指令所生成的请求标识信息及各所述服务接口的事件执行结果;
根据所述日志信息,确定执行事件服务的多个第一服务接口;及,按照所述请求标识信息对多个所述第一服务接口进行聚类,得到至少一个服务接口集;
从各所述服务接口集中筛选出所述事件执行结果为失败的第二服务接口;及,确定所述第二服务接口对应的接口位置信息为所述第二服务接口所在的服务接口集中的故障发生点。
在一个实施例中,所述日志信息还包括各所述服务接口之间的事件执行顺序;
相应的,在按照所述请求标识信息对多个所述第一服务接口进行聚类,得到至少一个服务接口集之后,还包括:
根据所述日志信息,确定各所述服务接口集中的各所述第一服务接口的事件执行顺序;
按照所述事件执行顺序,将各所述服务接口集中的各所述第一服务接口所对应的节点进行连接,得到至少一个路径网格;
所述从各所述服务接口集中筛选出所述事件执行结果为失败的第二服务接口;及,确定所述第二服务接口对应的位置信息为所述第二服务接口所在的服务接口集中的故障发生点,包括:
从各所述路径网格中筛选出所述事件执行结果为失败的第一节点;及,确定所述第一节点对应的接口位置信息为所述第一节点所在的路径网格中的故障发生点。
在一个实施例中,所述确定所述第一节点对应的接口位置信息为所述第一节点所在的路径网格中的故障发生点,包括:
若从所述路径网格中筛选出多个所述第一节点,则确定多个所述第一节点在所述路径网格中的连接顺序;
从多个所述第一节点中筛选出所述连接顺序位于最前的第二节点;及,确定所述第二节点对应的接口位置信息为所述第二节点所在的路径网格中的故障发生点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910288814.2/2.html,转载请声明来源钻瓜专利网。