[发明专利]一种基于RPC服务监控的集群服务故障预警系统在审
申请号: | 202110060005.3 | 申请日: | 2021-01-18 |
公开(公告)号: | CN112769622A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 孙冬英 | 申请(专利权)人: | 孙冬英 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L9/30;H04L29/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 253000 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 rpc 服务 监控 集群 故障 预警系统 | ||
本发明涉及集群服务故障预警技术领域,且公开了一种基于RPC服务监控的集群服务故障预警系统,包括:运行有集群服务故障预警系统服务端软件且部署在远程云端的云计算服务器CCScsfa,运行有集群服务故障预警系统用户端软件且用于执行集群服务器运维管理任务的计算机终端PCTcsfa,该计算机终端PCTcsfa通过网络通信设备与云计算服务器CCScsfa进行相互之间的通信连接;所述集群服务故障预警系统包括数据采集代理节点CNi、网关服务器、数据计算中心,该数据计算中心与网关服务器进行相互之间的通信连接,网关服务器与采集代理节点CNi进行相互之间的通信连接。本发明解决了如何通过对远程服务调用服务的监控操作,实现对集群系统的监控预警的技术问题。
技术领域
本发明涉及集群服务故障预警技术领域,具体为一种基于RPC服务监控的集群服务故障预警系统。
背景技术
随着计算机制造技术和网络通信技术的不断发展,集群系统因扩展性好、性价比高等优势,逐渐取代传统的大型机和巨型机,在众多工业领域取得广泛应用。然而,集群系统往往由普通计算机节点组成,无法保证每时每刻稳定可靠运行,节点故障或者网络问题,甚至是突增的访问量,都能够使集群中断服务。因此,集群监控成为保证集群稳健服务的关键技术。
集群系统的节点通常以远程服务调用的方式进行通信,节点通过调用其他节点的远程服务接口完成功能,同时本身亦通过远程服务调用接口对外提供服务。远程服务调用(Remote Procedure Call,RPC)是一种进程间通信方式,允许进程通过网络调用远程服务接口完成功能。然而,RPC服务因跨主机通信的缘故,因网络故障、对端故障而失败的几率大大增加。掌握RPC服务的成功率、延时等信息,有助于掌握集群服务现状、保障集群服务质量。因此,如何通过对远程服务调用服务的监控操作,实现对集群系统的监控预警,成为保障集群系统服务质量的一种有效解决方案。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供一种基于RPC服务监控的集群服务故障预警系统,以解决如何通过对远程服务调用服务的监控操作,实现对集群系统的监控预警的技术问题。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:
一种基于RPC服务监控的集群服务故障预警系统,包括:运行有集群服务故障预警系统服务端软件且部署在远程云端的云计算服务器CCScsfa,运行有集群服务故障预警系统用户端软件且用于执行集群服务器运维管理任务的计算机终端PCTcsfa,该计算机终端PCTcsfa通过网络通信设备与云计算服务器CCScsfa进行相互之间的通信连接;
所述集群服务故障预警系统包括数据采集代理节点CNi、网关服务器、数据计算中心,该数据计算中心与网关服务器进行相互之间的通信连接,网关服务器与采集代理节点CNi进行相互之间的通信连接。
进一步的,所述数据采集代理节点CNi被部署在每一台监控节点,负责收集被监控进程RPC框架通过进程间通信上报的监控数据,并将该数据主动发送到网关服务器。
进一步的,所述数据计算中心负责大规模监控数据流的实时计算和实时分析,主要包含数据清洗模块、数据统计模块、结果分析与告警模块、数据存储模块。
进一步的,所述数据分析和告警模块负责基于阈值判断规则对监控数据流的统计结果进行分析,判断是否需要向运维平台发出告警。
(三)有益的技术效果
与现有技术相比,本发明具备以下有益的技术效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于孙冬英,未经孙冬英许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110060005.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电动机组件
- 下一篇:一种粉末成形机的侧压机构及粉末成形机