[发明专利]一种基于云计算的智能监控分析方法及系统在审
申请号: | 202211018109.9 | 申请日: | 2022-08-24 |
公开(公告)号: | CN115442212A | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 任寿杰 | 申请(专利权)人: | 浪潮云信息技术股份公司 |
主分类号: | H04L41/0631 | 分类号: | H04L41/0631;H04L41/0677;H04L43/0823;H04L67/12 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜鹏 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 计算 智能 监控 分析 方法 系统 | ||
本发明涉及云环境下智能运维技术领域,具体为一种基于云计算的智能监控分析方法,包括以下步骤:基于运维场景中大量的指标(KPI)聚类,基于资源的关键性指标(KPI)分析,检测异常KPI;基于异常KPI进行分析定位,定位异常发生原因;有益效果为:本发明提出的基于云计算的智能监控分析方法及系统实现快速定位云服务异常信息,提升客户的满意度,依托云计算建立智能监控服务,合并现有的监控孤岛,通过AI等手段加强数据分析以及监控功能,保证客户云上业务平稳运行的同时,降低告警风暴发生的影响,帮助运维人员快速响应告警,定位告警发生根本原因并智能推荐解决方法。
技术领域
本发明涉及云环境下智能运维技术领域,具体为一种基于云计算的智能监控分析方法及系统。
背景技术
近年来,全球云计算支出以及云服务的需求出现了爆发式增长,云服务已经深入到社会的各个领域,运维人员每天需要面对TB乃至PB数量级的性能指标数据,传统运维面临挑战。
现有技术中,在面对海量KPI数据的同时,运维人员需要及时的发现、处理告警,然而数据爆炸的云时代传统运维人工巡检的方式不再合适,告警的信息价值在于实时性、准确性。
但是,随着业务场景的不断复杂,客户对应用上云的需求也越来越严苛,运维人员处理告警的效率也必须提高,因此运维人员需要一种云环境中的智能监控方法,不仅可以帮助运维人员快速响应,还能根据告警、资源等信息分析出告警发生的根本原因。
发明内容
本发明的目的在于提供一种基于云计算的智能监控分析方法及系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于云计算的智能监控分析方法,所述基于云计算的智能监控分析方法包括以下步骤:
基于运维场景中大量的指标(KPI)聚类,基于资源的关键性指标(KPI)分析,检测异常KPI;
基于异常KPI进行分析定位,定位异常发生原因;
基于KPI对负载核心指标预测,为用户提供容量预警通知以及资源增减配操作的相关建议;
通过告警规则管理对实时处理过程进行控制。
优选的,检测异常KPI时,通过算法的数据预处理模块,对原始的KPI数据进行标准化,消除振幅差异;
将预处理之后的数据输入到基线提取模块,该模块会去除KPI曲线上的噪声和可能的异常点,提取出基线来表示曲线的形状。
优选的,定位异常发生原因时,采用基于形状聚类的SBD距离作为相似性度量,消除KPI曲线之间的相位偏差;
为用户提供容量预警通知时,KPI数据按照时序进入算法模块,特征抽取整合原始特征(可能会产生新的特征),然后被输入到集成了传统线性预测方法的训练模块,训练结果为未来资源工作负载核心指标的使用情况,与预先设定的阈值进行比较,超出阈值,自动发出资源增配通知。
优选的,过告警规则管理对实时处理过程进行控制包括,告警纳管、业务规则管理与告警实时处理、告警场景分析以及告警经验库四部分;
告警纳管:运维人员可以通过界面配置平台告警与标准告警之间的映射关系,配置规则生效后,系统自动对平台告警按照规则配置转换为标准告警格式,完成告警的汇聚纳管;
业务规则管理与告警实时处理:运维人员通过规则管理的界面配置通知、拟合、压缩、告警重定义等一系列的规则,告警实时处理依托实时处理框架(Flink),监听消息队列,将规则配置动态加载至内部集成的规则引擎,规则引擎将告警与规则执行匹配操作,然后完成预设的告警处理流程;
告警场景分析:告警聚类为场景,需要使用大量历史告警对聚类模型进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211018109.9/2.html,转载请声明来源钻瓜专利网。