[发明专利]批量故障的确定方法和装置,计算机存储介质和电子设备在审
申请号: | 202010121380.X | 申请日: | 2020-02-26 |
公开(公告)号: | CN113312197A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 陈立波;刘毅;邵伯仲;于林锋 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;窦晓慧 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 批量 故障 确定 方法 装置 计算机 存储 介质 电子设备 | ||
本申请公开一种批量故障的确定方法和装置,监控方法和装置,故障预警系统以及计算机存储介质和电子设备,其中确定方法包括:获取单体故障信息以及用于描述数据中心服务设备的配置信息;根据所述配置信息,对所述单体故障信息进行配置维度扩展,获得单体故障维度数据集合;根据所述单体故障维度数据集合和设定的批量故障判断条件,确定批量故障的数据集合,从而降低批量故障定位的复杂度。
技术领域
本申请涉及计算机技术领域,具体涉及一种批量故障的确定方法和装置,本申请同时涉及一种批量故障预警系统,计算机存储介质和电子设备。
背景技术
随着云计算和大数据的发展,数据中心的规模越来越庞大,大量服务器被采购和部署使用。为实现大数据的处理会存在大量应用,大量服务器,以及大量的部件,而在数据中心运行过程中存在发生故障的可能性,目前发生的故障形式可以包括单体故障和批量故障。
所谓单体故障是指数据中心中某一独立的应用、独立的服务器或独立的部件等发生的故障,单体故障均可以通过容错技术实现屏蔽。
所谓批量故障是指大范围服务设备或软件应用等发生的故障。例如,同一时间内或同一供应商提供的设备内的大量应用,大量服务器,大量部件中任意一种或多种发生的故障,而且很多故障是在特定业务、特定机房、特定厂家发生,所以故障发生定位变得异常复杂,在故障发生的复杂场景下,简单软件容错技术无法实现对故障的处理。
发明内容
本申请提供一种批量故障的确定方法,以解决现有技术中批量故障定位复杂性的问题。
本申请提供一种批量故障的确定方法,包括:
获取单体故障信息以及用于描述数据中心服务设备的配置信息;
根据所述配置信息,对所述单体故障信息进行配置维度扩展,获得单体故障维度数据集合;
根据所述单体故障维度数据集合和设定的批量故障判断条件,确定批量故障的数据集合。
在一些实施例中,所述获取单体故障信息,包括:
获取数据中心监测到的单独实体的单体故障信息。
在一些实施例中,还包括:
对所述单体故障信息进行格式化操作,获得单体故障工单;
所述获取用于描述数据中心服务设备的配置信息,包括:
根据所述单体故障工单,获取配置管理数据库中用于描述数据中心服务设备的配置信息,所述配置管理数据库中存储有描述网络环境中实体的配置信息。
在一些实施例中,所述根据所述配置信息,对所述单体故障信息进行配置维度扩展,获得单体故障维度数据集合,包括:
根据所述配置信息中的配置项,确定配置维度;
根据所述配置维度和所述单体故障信息,构建所述单体故障维度数据集合。
在一些实施例中,还包括:
根据对所述单体故障维度数据集合之间的关联分析,确定候选故障维度数据集合;
所述根据所述单体故障维度数据集合和设定的批量故障判断条件,确定批量故障的数据集合,包括:
根据所述候选故障维度数据集合和设定的批量故障判断条件,确定所述候选故障维度数据集合是否为批量故障的数据集合。
在一些实施例中,所述根据对所述单体故障维度数据集合之间的关联分析,确定候选故障维度数据集合,包括:
对所述单体故障维度数据集合进行频繁项集挖掘;
将所述频繁项集范围中出现频率满足出现频率要求的频繁项集,确定为候选故障维度数据集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010121380.X/2.html,转载请声明来源钻瓜专利网。