[发明专利]一种分布式集群系统及其实现方法有效
申请号: | 201210113460.6 | 申请日: | 2012-04-17 |
公开(公告)号: | CN102638372A | 公开(公告)日: | 2012-08-15 |
发明(设计)人: | 邸双朋 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/08 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 栗若木;曲鹏 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 集群 系统 及其 实现 方法 | ||
技术领域
本发明涉及计算机集群技术领域,具体涉及一种分布式集群系统及其实现方法。
背景技术
目前的高性能计算集群规模都比较大,一个集群中包含上千个计算节点,在对这些计算节点管理和监控的过程中,需要通过分布式程序统一给这些节点发送请求,收集返回数据。
传统的分布式系统大多采用java,C等语言开发,管理端程序和代理端程序作为单独的进程运行在节点的操作系统中。这种方式开发和测试的时间较长,例如,中等规模的程序需要几个月的时间。因此,对于一些比较紧急的需求来说,目前的分布式系统在时间上是无法满足的。并且,传统的公布式系统中程序作为单独的进程运行在各节点上,势必占用计算节点的系统资源,降低高性能计算的效率。另外,传统的公布式系统的扩展性也很差,如果需要在程序中添加新的功能,则需要对程序进行修改和重新编译,编译完成后需要在集群中重新部署新的程序。可见,整个扩展过程复杂,而且耗时。不能满足快速扩展功能的需求。
发明内容
本发明所要解决的技术问题是,提供一种分布式集群系统及其实现方法,以解决传统的公布式系统开发测试时间过长的问题。
为了解决上述技术问题,本发明公开了一种分布式集群系统,包括一个部署在管理节点上的管理端功能模块,以及部署在各计算节点上的代理端功能模块,其中:
所述管理端功能模块,根据用户指令向各代理端功能模块发送用于获取计算节点的运行状态数据的http请求,以及接收各代理端功能模块返回的运行状态数据,对接收到的运行状态数据进行处理和显示;
所述代理端功能模块,接收所述管理端功能模块发送的http请求,根据所收到的http请求读取本计算节点的运行状态数据,并将读取的运行状态数据返回给所述管理端功能模块。
较佳地,上述系统中,所述http请求中包含有所要获取的计算节点的url,以及所要获取的计算节点的运行状态数据。
较佳地,上述系统中,所述管理端功能模块由shell脚本实现。
较佳地,上述系统中,所述代理端功能模块,由部署在计算节点的web服务器httpd中一组cgi脚本实现。
较佳地,上述系统中,其特征在于,所述代理端功能模块,由部署在计算节点的web服务器httpd中一组cgi脚本实现指:
将所述cgi脚本保存在管理节点的共享目录中,计算节点的web服务器httpd通过共享服务调用所述cgi脚本以实现所述代理端功能模块的操作。
本发明还公开了一种分布式集群系统的实现方法,包括:
管理节点根据用户指令向各计算节点发送用于获取计算节点的运行状态数据的http请求;
接收到所述http请求的计算节点,根据所收到的http请求读取本计算节点的运行状态数据,并将读取的运行状态数据返回给所述管理节点;
所述管理节点收集各计算节点返回的运行状态数据,对收到的运行状态数据进行处理并显示给集群用户。
较佳地,上述方法中,所述http请求中包含有所要获取的计算节点的url,以及所要获取的计算节点的运行状态数据。
较佳地,上述方法还包括,在所述管理节点上部署一管理端功能模块,由该管理端功能模块向各计算节点发送用于获取各计算节点的运行状态数据的http请求,其中,所述管理端功能模块采用shell脚本实现。
较佳地,上述方法还包括,在各计算节点上部署一代理端功能模块,由该代理端功能模块接收所述http请求,根据所收到的http请求读取本计算节点的运行状态数据,并将读取的运行状态数据返回给所述管理节点,其中,该代理端功能模块由部署在计算节点的web服务器httpd中一组cgi脚本实现。
较佳地,上述方法中,所述代理端功能模块由部署在计算节点的web服务器httpd中一组cgi脚本实现指:
将所述cgi脚本保存在管理节点的共享目录中,计算节点的web服务器httpd通过共享服务调用所述cgi脚本以实现所述代理端功能模块的操作。
本申请技术方案使可以在集群系统中快速部署管理端程序和代理端程序,并通过集群的管理节点对各个计算节点进行管理和监控,具有开发部署速度快,可扩展性强的优点,并针对高性能计算集群的监控和管理方面提高了工作效率。
附图说明
图1为本实施例提供的分布式集群系统的物理拓扑示意图;
图2为本实施例中实现的集群系统的测试结果图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210113460.6/2.html,转载请声明来源钻瓜专利网。