[发明专利]计算机状态更新方法、装置及分布式系统有效
申请号: | 201010527361.3 | 申请日: | 2010-10-28 |
公开(公告)号: | CN102455991A | 公开(公告)日: | 2012-05-16 |
发明(设计)人: | 刘睿涛;钱宇;龚道永;岳霖霖;付金辉 | 申请(专利权)人: | 无锡江南计算技术研究所 |
主分类号: | G06F15/16 | 分类号: | G06F15/16 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 骆苏华 |
地址: | 214083 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机 状态 更新 方法 装置 分布式 系统 | ||
技术领域
本发明涉及通信技术领域,更具体地,特别涉及一种计算机状态更新方法、装置及分布式系统。
背景技术
SLURM(Simple Linux Utility for Resource Management,简易linux资源管理工具)系统作为当前最为流行的分布式系统,由美国LLNL(劳伦斯利弗莫尔国家实验室)国家实验室负责开发,其安装部署的集群系统已超过2000个。SLURM系统包括:一个总控和多个计算节点代理,每个计算机代理节点连接一个计算机,而总控负责监测系统内的所有计算机代理节点,进而实现对系统内所有计算机的监测。
总控对计算机代理节点的实时监测采用组内串行,组间并行的方式,即总控派生多个并发线程,根据线程个数将系统内的计算机代理节点划分成多个计算机代理组,且计算机代理组的数量与线程数量相一致。总控所派生的每个线程负责探测一组计算机代理组,总控主动向同一计算机代理组内的所有计算机代理节点发送探测包,依次接收该组内计算机代理节点的关于与其对应计算机工作状态的回应,实现对同组内所有计算机代理节点的状态监测,即实现对同组内所有计算机的工作状态监测。
但是,总控派生的并发线程的数量受到分布式系统的限制,其数量最多为几十个线程。因此,当SLURM系统内计算机代理节点数量庞大时,总控扫描一遍同一计算机代理组内的计算机代理节点所对应的计算机的工作状态花费的时间非常长,特别是该组内计算机全部停机,其扫描一遍计算机工作状态所花费的时间最长。以2000个计算机代理节点,总控并发线程40个,探测每个计算机代理节点所对应的计算机的工作状态花费5秒钟为例,总控扫描一遍计算机的工作状态花费的总时间大于4分钟。然而,当SLURM系统内计算机的工作状态在4分钟时间内发生变化时,总控不能及时监测和更新计算机工作状态,例如:系统内第一个被探测的计算机的工作状态由停机转为开机,由于总控采用组内串行监测的方式,所以只有当总控扫描完一遍同一计算机组内的计算机的工作状态后,才能再次监测第一个被探测的计算机的工作状态,进而当计算机的工作状态变更时,总控不能实时监测和更新该计算机的工作状态。
发明内容
有鉴于此,本发明的目的在于提供一种计算机状态更新方法及系统,以实现实时监测和更新系统内的计算机工作状态变更。
为实现上述目的,本发明提供的一种计算机状态更新方法的技术方案如下:
一种计算机状态更新方法,包括:
接收计算机代理节点上报的工作状态信息;
将所述工作状态信息表示的工作状态确定为所述计算机代理节点对应的计算机的当前工作状态;
将该当前工作状态与前一次接收工作状态信息后确定的该计算机的工作状态进行比较,在比较结果满足预设条件时,生成计算机工作状态变更信息;
发送所述计算机工作状态变更信息给总控,由所述总控更新记录在所述总控内的该计算机的工作状态。
一种分控节点,包括:
工作状态信息接收单元,用于接收计算机代理节点上报的工作状态信息;
与工作状态信息接收单元相连的工作状态确定单元,用于将所述工作状态信息表示的工作状态确定为所述计算机代理节点对应的计算机的当前工作状态;
与工作状态确定单元相连的比较单元,用于将该当前工作状态与前一次接收工作状态信息后确定的该计算机的工作状态进行比较;
与比较单元相连的状态变更信息生成单元,用于在比较结果满足预设条件时,生成计算机工作状态变更信息;
与状态变更信息生成单元相连的状态变更信息发送单元,用于发送所述计算机工作状态变更信息给总控,由所述总控更新记录在所述总控内的该计算机的工作状态。
一种计算机状态更新方法,包括:
上报用于分控节点指示对应的计算机工作状态的工作状态信息;
所述工作状态信息用于作为分控节点确定计算机的当前工作状态的依据,并在当前工作状态与前一次接收工作状态信息后确定的该计算机的工作状态的比较结果满足预设条件时,作为分控节点生成计算机工作状态变更信息的依据;所述计算机工作状态变更信息用于指示总控更新所述计算机的计算机工作状态。
一种计算机代理节点,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010527361.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:工艺数据分析方法和系统
- 下一篇:一种采用交流电法测定离子交换膜面电阻的装置