[发明专利]一种混合云管的异常实时上报方法、系统、设备和介质有效
申请号: | 202310068437.8 | 申请日: | 2023-02-06 |
公开(公告)号: | CN115801545B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 李德栋 | 申请(专利权)人: | 天翼云科技有限公司 |
主分类号: | H04L41/0631 | 分类号: | H04L41/0631;H04L41/0681;H04L43/08;H04L43/04 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 异常 实时 上报 方法 系统 设备 介质 | ||
1.一种混合云管的异常实时上报方法,其特征在于,应用于集成prometheus服务,所述方法包括:
利用集成prometheus服务获取混合云管系统的原始metrics数据;
对所述原始metrics数据进行聚类,得到metrics数据,所述metrics数据是按照云系统、资源池、主功能、子功能这四个类别进行分类的数据;
按照逻辑组合对所述metrics数据进行处理,得到场景数据,包括:按照云系统、资源池、主功能、子功能分类,分别对各类别在预设时间内的metrics数据进行处理,得到各类别在预设时间内的场景数据,对不同预设时间内metrics数据进行处理,得到不同预设时间内的场景数据;
在所述场景数据触发报警条件的情况下,上报异常信息。
2.根据权利要求1所述的方法,其特征在于,所述利用集成prometheus服务获取混合云管系统的原始metrics数据,包括:
利用所述集成prometheus服务,按照预设时间间隔定时向所述混合云管系统发送原始metrics数据获取请求;
接收所述混合云管系统返回的原始metrics数据;
对所述原始metrics数据进行聚类,得到metrics数据,包括:
按照云系统、资源池、主功能、子功能对所述原始metrics数据进行聚类,得到metrics数据。
3.根据权利要求1所述的方法,其特征在于,所述在所述场景数据触发报警条件的情况下,上报异常信息,包括:
基于grafana可视化平台制定报警规则,在所述场景数据满足报警条件的情况下,上报所述场景数据对应的异常信息。
4.根据权利要求3所述的方法,其特征在于,在同时上报多个异常信息的情况下,所述方法还包括:
利用alertmanager模块判断同时上报的多个异常信息是否相同;
在所述多个异常信息相同的情况下,对所述多个异常信息进行一次处理;
在所述多个异常信息不相同的情况下,分别对每个异常信息进行处理。
5.根据权利要求1所述的方法,其特征在于,所述在所述场景数据触发报警条件的情况下,上报异常信息,包括:
所述场景数据触发报警条件的情况下,基于webhook模块进行自定义梯度报警:
通过对报警消息做webhook,利用自定义服务统计报警持续时长;
根据所述报警持续时长,按照自定义的梯度报警规则,将所述异常信息上报至相应的业务处理终端进行处理。
6.根据权利要求5所述的方法,其特征在于,所述根据所述报警持续时长,按照自定义的梯度报警规则,将所述异常信息上报至相应的业务处理终端进行处理,包括:
当所述报警持续时长未超过第一预设时长时,不通知相应的业务处理终端处理异常信息;
当所述报警持续时长超过所述第一预设时长后还在继续报警时,利用第一上报方式,通知相应的业务处理终端处理异常信息;
当所述报警持续时长超过第二预设时长还在继续报警时,利用第二上报方式,通知相应的业务处理终端处理异常信息;
当所述报警持续时长超过第三预设时长还在继续报警时,利用第三上报方式,通知相应的业务处理终端处理异常信息;
其中,所述第一预设时长小于所述第二预设时长,所述第二预设时长小于所述第三预设时长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼云科技有限公司,未经天翼云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310068437.8/1.html,转载请声明来源钻瓜专利网。