[发明专利]一种基于代理技术的网格计算容错系统及方法有效
申请号: | 200910087661.1 | 申请日: | 2009-06-30 |
公开(公告)号: | CN101594254A | 公开(公告)日: | 2009-12-02 |
发明(设计)人: | 廖馨;赵雯;孔文秦;王悦 | 申请(专利权)人: | 中国运载火箭技术研究院 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L1/22;H04L29/06 |
代理公司: | 中国航天科技专利中心 | 代理人: | 安 丽 |
地址: | 100076北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 代理 技术 网格 计算 容错 系统 方法 | ||
1.一种基于代理技术的网格计算容错系统,其特征在于:包括一个主节点、一个备份节点和多个计算节点;主节点上设置主控代理容器、主控代理和主监控代理;备份节点上设置备份代理容器和备份监控代理;每个计算节点上设置节点代理容器、监控代理和作业代理;
主控代理,按预定心跳周期检查主节点上是否存在未分发的工作,为未分发的工作选择计算节点,并将该工作的作业信息和选择的计算节点地址发送给主控代理容器;主控代理接收到主监控代理的计算节点失效信息时,查询该计算节点上分配的作业信息,并将作业状态改为“未分发”;按预定备份周期检查是否存在备份节点,当存在备份节点时,则向主控代理容器发送备份请求;
主控代理容器,接收主控代理的作业信息和计算节点地址,创建作业代理,并将其迁移到计算节点上;接收主控代理的备份请求,备份主控代理,并将其序列化处理成为字节流,传输至备份代理容器;
主监控代理,根据接收的节点监控代理发出的心跳信号和状态信息,向节点监控代理发送心跳确认消息,或者将计算节点的失效消息发送给主控代理;当接收到主控代理发送的计算节点状态查询请求时,发送所有空闲的计算节点状态;根据作业代理发送的迁移查询请求,设置迁移目标节点,并向作业代理发回迁移条件满足消息和迁移目标节点地址;
节点代理容器,根据接收的作业代理发送的迁移请求,将满足迁移条件的作业代理挂起,向作业代理发送挂起消息,挂起成功后将所述的满足迁移条件的代理迁移到所述的迁移目标节点上;接收迁移的字节流,对该字节流处理后向节点代理容器发送开始或重启该作业代理消息;
作业代理,根据接收到的节点代理容器发送的不同消息,对计算节点上当前作业进行处理,分析作业代理的运行情况,将当前的负载水平和作业运行情况发送给节点监控代理;根据主监控代理发送的迁移条件满足消息和迁移目标节点地址,向节点代理容器发送迁移请求;
节点监控代理,将接收的作业代理发送的负载水平和作业运行情况与心跳信号一起合并为心跳信号和状态信息发送给主监控代理;根据接收的主监控代理发送的心跳确认消息,对主节点是否失效进行判断,根据判断结果,向备份监控代理发出主节点错误消息或主节点确认消息;根据接收的备份监控代理发送的主节点地址更改消息,更改自身保存的主节点和备份节点的地址;
备份监控代理,根据节点监控代理发出的主节点确认消息或主节点错误消息,判断主节点是否失效,当主节点失效时,向备份代理容器发送主节点恢复消息,并向所有计算节点监控代理发送广播消息,通知所有计算节点监控代理更改主节点地址;
备份代理容器,从主控代理容器接收主控代理备份字节流并存储;备份代理容器从备份监控代理接收主节点恢复消息,在备份节点上创建主监控代理,根据存储的主控代理备份字节流恢复主控代理,运行主控代理,并删除备份监控代理。
2.根据权利要求1所述的一种基于代理技术的网格计算容错系统,其特征在于所述的主控代理的实现过程如下:
按预定心跳周期检查主节点上是否存在未分发的工作,判断是否接收到主监控代理发送的计算节点失效信息;
若存在未分发的工作,向主监控代理发送计算节点状态查询请求;根据主监控代理发送的所有空闲计算节点状态,选择计算节点,将未分发工作的作业信息和选择的计算节点地址发送给主控代理容器;
若接收到所述的计算节点失效信息,则查询所述失效计算节点上分配的作业信息,将其作业状态改为“未分发”;
按预定备份周期判断是否存在备份节点,若存在备份节点,则向主控代理容器发送备份请求。
3.根据权利要求1所述的一种基于代理技术的网格计算容错系统,其特征在于所述的主监控代理的实现过程如下:
判断是否接收到节点监控代理发出的心跳信号和状态信息,若收到后向节点监控代理发送心跳确认消息,否则等待一个心跳周期,判断是否收到所述节点监控代理发出的心跳信号和状态信息,若没有收到,则认为该计算节点失效,向主控代理发送计算节点失效消息;
判断是否接收到主控代理发送的计算节点状态查询请求,或者作业代理发送的迁移查询请求;若接收到主控代理发送的计算节点状态查询请求时,则发送所有空闲的计算节点状态给主控代理;若接收到作业代理发送的迁移查询请求,查询主监控代理中维护的节点状态表,如果存在空闲节点,且其空闲计算能力高于发出迁移查询请求的节点,则将该空闲节点设置为迁移目标节点,并向作业代理发回迁移条件满足消息和迁移目标节点地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国运载火箭技术研究院,未经中国运载火箭技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910087661.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:链路检测方法
- 下一篇:混合动力汽车电机转子定位系统及其定位方法