[发明专利]一种集群信息的监控方法无效
申请号: | 200710115167.2 | 申请日: | 2007-12-13 |
公开(公告)号: | CN101183996A | 公开(公告)日: | 2008-05-21 |
发明(设计)人: | 魏健;王守昊 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L12/24;H04L12/28 |
代理公司: | 济南信达专利事务所有限公司 | 代理人: | 姜明 |
地址: | 250014山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 集群 信息 监控 方法 | ||
1.技术领域
本发明涉及集群系统信息监控的方法,特别涉及大规模集群中信息监控的方法。
2.技术背景
近年来,随着计算机技术的发展,用集群构造超级计算机或超级服务器成为一种流行的趋势。集群的规模从过去的数个节点扩充到数百个节点甚至数千个节点,集群系统的管理监控也变得越来越复杂,集群的管理监控越来越成为一项具有挑战性的工作。如何有效的监控集群系统以及对集群进行维护都成为集群管理员费时费力的工作。由于收集的监控信息是海量的、未经处理的,用户无法直观的从这些数据中获得优化集群系统的依据。
3.发明内容
本发明的是要解决大规模集群中有效的对节点进行信息监控的问题,以及收集的信息未经过处理,用户难以理解,难以对集群的系统优化进行数据支持的问题。
本发明提供了一种集群信息监控方法,本发明的方法包括监控Controller、信息收集模块、报警模块和记账统计模块,其中监控Controller:控制信息模块收集信息,将节点拓扑关系传递给信息收集模块,信息收集模块根据拓扑关系,形成信息传递链收集集群中节点的信息,报警模块与信息收集模块相连,按用户设定的报警方式,mail、手机短信方式,向用户提供告警;记账统计模块与信息收集模块相连,将信息收集模块收集信息进行处理,跟踪集群资源的消费情况。
监控Controller自动读取配置文件中节点信息,将监控Controller运行的节点,作为根节点,也称为主管理节点(MM),根据广度优先的原则依次挂接其他节点作为普通节点(NM),当主管理节点(MM)的挂接数目达到饱和值时,启动一普通节点使其成为子管理节点(SM),继续挂接普通节点,当该子管理节点(SM)达到饱和值时,主管理节点又启动另一普通节点进行挂接,依次类推当所有普通节点都成为子管理节点时,再启动子管理节点下的普通节点成为子管理节点,直到配置文件中的所有节点都挂接完成。信息收集模块启动信息收集时,所有普通节点的信息向上传递给其子管理节点,子管理节点将信息进行链接,并将其自身的信息链接在后面,然后再向上一级子管理节点传递,最终到达主管理节点,主管理节点将收到与饱和值相当数量的信息链。这种传递信息的方式能够确保监控信息在网络上的转发次数最少,提高监控任务的执行效率。这种传递信息的方式,易于集群规模的扩展。
信息收集模块收集的信息包括:节点的CPU、内存、网络的负载信息,以及磁盘容量、CPU温度、电压、风扇转速、用户联机时间,信息收集模块收集到这些信息后与用户设定的阀值进行比较,一旦发现超出设定的域值,就按用户设定的报警方式进行告警。用户可以设定的报警方式包括:mail、手机短信;方便用户及时的获得故障信息,快速处理故障,提高整个集群系统的可用性。
记账统计模块将信息收集模块收集到的信息进行处理后存入数据库,并可按用户的要求输出CPU消费报表、网络流量报表,为用户对集群的系统优化提供数据支持和分析依据。
本发明集群信息监控方法,所具有的有益效果是:提高了集群系统的可用性和监控信息的通讯效率,确保监控信息在网络上的转发次数最少,提高监控任务的执行效率;完善报警机制和方便管理员快速发现故障。
4.附图说明
图1集群信息监控工作原理图;
图2集群信息监控流程图
图3集群信息监控拓扑结构和信息传递链示意图。
5.实施方式
下面通过附图和实施例对本发明的技术方案做进一步的详细描述。
如图1所示,为本发明的一实施例的基本结构示意图,本发明的方法包括设置监控Controller、信息收集模块、报警模块、记账统计模块,其中监控Controller是整个监控过程的核心,对整体的运行进行控制;信息收集模块与监控Controller相连,从监控Controller获得节点拓扑关系,形成信息传递链,收集集群中节点的信息,依此信息传递方式,能够减少通讯开支,且有很好的扩展性;报警模块与信息收集模块相连,判断信息收集模块收集的信息是否超出阀值,如果是,则按用户设定的报警方式:mail、手机短信方式,向用户提供性能预警和硬件告警;记账统计模块与信息收集模块相连,将判断信息收集模块收集的信息存入数据库保存,为以后的处理做准备,也可按用户的要求输出CPU消费报表、网络流量报表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710115167.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置