[发明专利]一种混合云管的异常实时上报方法、系统、设备和介质有效
申请号: | 202310068437.8 | 申请日: | 2023-02-06 |
公开(公告)号: | CN115801545B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 李德栋 | 申请(专利权)人: | 天翼云科技有限公司 |
主分类号: | H04L41/0631 | 分类号: | H04L41/0631;H04L41/0681;H04L43/08;H04L43/04 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 异常 实时 上报 方法 系统 设备 介质 | ||
本发明实施例中提供了一种混合云管的异常实时上报方法、系统、设备和介质,所述方法包括:利用集成prometheus服务获取混合云管系统的原始metrics数据;对所述原始metrics数据进行聚类,得到metrics数据;按照逻辑组合对所述metrics数据进行处理,得到场景数据;在所述场景数据和/或所述metrics数据触发报警条件的情况下,上报异常信息。在本发明实施例中,将以往被动发现问题转变为主动发现问题,进而有效的提高混合云管系统各类功能操作失败情况的发现、定位效率,提升系统异常捕获覆盖度,为混合云管系统提供了实时、准确的持续优化能力,从而有效提升用户满意度。
技术领域
本发明涉及云计算中的逻辑可用性监测领域,特别涉及一种混合云管的异常实时上报方法、系统、设备和介质。
背景技术
在国家云的大背景下,很多政企单位业务遍布全国,且对云计算的需求越来越多样化,由此,私有云+公有云的混合云形态逐渐成为政企云业务的发展趋势,然而伴随混合云多样化能力而来的是更复杂的部署架构和使用场景,所以发现系统中问题与异常的难度也呈指数级增长,尤其是系统交付后的生产环境问题。
目前,大部分云厂商对云管业务异常处理的主要方案是通过记录运行日志,或在用户使用出现异常时联系运维人员,运维人员介入处理,或先提交缺陷,待开发人员定期排查解决。这类上报方法更关注当前使用的业务功能,对关联功能和非关注功能关注度低,进而覆盖度低;由于人工介入过多,导致实时性差,且成本极高。
发明内容
鉴于上述问题,本发明实施例提供了一种混合云管的异常实时上报方法、系统、设备和介质,以便克服上述问题或者至少部分地解决上述问题。
本发明实施例的第一方面,公开了一种混合云管的异常实时上报方法,应用于集成prometheus服务,所述方法包括:
利用集成prometheus服务获取混合云管系统的原始metrics数据;
对所述原始metrics数据进行聚类,得到metrics数据;
按照逻辑组合对所述metrics数据进行处理,得到场景数据;
在所述场景数据和/或所述metrics数据触发报警条件的情况下,上报异常信息。
可选地,所述利用集成prometheus服务获取混合云管系统的原始metrics数据,包括:
利用所述集成prometheus服务,按照预设时间间隔定时向所述混合云管系统发送原始metrics数据获取请求;
接收所述混合云管系统返回的原始metrics数据;
对所述原始metrics数据进行聚类,得到metrics数据,包括:
按照云系统、资源池、主功能、子功能对所述原始metrics数据进行聚类,得到metrics数据。
可选地,按照逻辑组合对所述metrics数据进行处理,得到场景数据,包括:
按照云系统、资源池、主功能、子功能分类,分别对各类别在预设时间内的metrics数据进行处理,得到各类别在预设时间内的场景数据。
可选地,所述在所述场景数据和/或所述metrics数据触发报警条件的情况下,上报异常信息,包括:
基于grafana可视化平台制定报警规则,在所述场景数据和/或所述metrics数据满足报警条件的情况下,上报所述场景数据和/或所述metrics数据对应的异常信息。
可选地,在同时上报多个异常信息的情况下,所述方法还包括:
利用alertmanager模块判断同时上报的多个异常信息是否相同;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼云科技有限公司,未经天翼云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310068437.8/2.html,转载请声明来源钻瓜专利网。