[发明专利]一种基于代理技术的网格计算容错系统及方法有效
申请号: | 200910087661.1 | 申请日: | 2009-06-30 |
公开(公告)号: | CN101594254A | 公开(公告)日: | 2009-12-02 |
发明(设计)人: | 廖馨;赵雯;孔文秦;王悦 | 申请(专利权)人: | 中国运载火箭技术研究院 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L1/22;H04L29/06 |
代理公司: | 中国航天科技专利中心 | 代理人: | 安 丽 |
地址: | 100076北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于代理技术的网格计算容错系统及方法,该系统包括一个主节点、一个备份节点和多个计算节点;主节点上设置主控代理容器、主控代理和主监控代理;备份节点上设置备份代理容器和备份监控代理;计算节点上设置节点代理容器、监控代理和作业代理;采用本系统及方法能够在网格主节点掉线,或负荷过重崩溃时,处理网格主节点的错误。在网格计算节点掉线,或负荷过重掉线时,及时对计算作业进行重新分配。在计算节点负荷过重、作业响应时间过长时,对计算作业进行迁移。 | ||
搜索关键词: | 一种 基于 代理 技术 网格 计算 容错 系统 方法 | ||
【主权项】:
1、一种基于代理技术的网格计算容错系统,其特征在于:包括一个主节点、一个备份节点和多个计算节点;主节点上设置主控代理容器、主控代理和主监控代理;备份节点上设置备份代理容器和备份监控代理;每个计算节点上设置节点代理容器、监控代理和作业代理;主控代理,按预定心跳周期检查主节点上是否存在未分发的工作,为未分发的工作选择计算节点,并将该工作的作业信息和选择的计算节点地址发送给主控代理容器;主控代理接收到主监控代理的计算节点失效信息时,查询该节点上分配的作业信息,并将作业状态改为“未分发”;按预定备份周期检查是否存在备份节点,当存在备份节点时,则向主控代理容器发送备份请求;主控代理容器,接收主控代理的作业信息和计算节点地址,创建作业代理,并将其迁移到计算节点上;接收主控代理的备份请求,备份主控代理,并将其序列化处理成为字节流,传输至备份代理容器;主监控代理,根据接收的节点监控代理发出的心跳信号和状态信息,向节点监控代理发送心跳确认消息,或者将计算节点的失效消息发送给主控代理;当接收到主控代理发送的计算节点状态查询请求时,发送所有空闲的计算节点状态;根据作业代理发送的迁移查询请求,设置迁移目标节点,并向作业代理发回迁移条件满足消息和迁移目标节点地址;节点代理容器,根据接收的作业代理发送的迁移请求,将满足迁移条件的代理挂起,向作业代理发送挂起消息,挂起成功后将所述的满足迁移条件的代理迁移到所述的迁移目标节点上;接收迁移的字节流,对该字节流处理后向节点代理容器发送开始或重启该作业代理消息;作业代理,根据接收到的节点代理容器发送的不同消息,对计算节点上当前作业进行处理,分析作业代理的运行情况,将当前的负载水平和作业运行情况发送给节点监控代理;根据主监控代理发送的迁移条件满足消息和迁移目标节点地址,向节点代理容器发送迁移请求;节点监控代理,将接收的作业代理发送的负载水平和作业运行情况与心跳信号一起合并为心跳信号和状态信息发送给主监控代理;根据接收的主监控代理发送的心跳确认消息,对主节点是否失效进行判断,根据判断结果,向备份监控代理发出主节点错误消息或主节点确认消息;根据接收的备份监控代理发送的主节点地址更改消息,更改自身保存的主节点和备份节点的地址;备份监控代理,根据节点监控代理发出的主节点确认消息或主节点错误消息,判断主节点是否失效,当主节点失效时,向备份代理容器发送主节点恢复消息,并向所有计算节点监控代理发送广播消息,通知所有计算节点监控代理更改主节点地址;备份代理容器,从主控代理容器接收主控代理备份字节流并存储;备份代理容器从备份监控代理接收主节点恢复消息,在备份节点上创建主监控代理,根据存储的主控代理备份字节流恢复主控代理,运行主控代理,并删除备份监控代理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国运载火箭技术研究院,未经中国运载火箭技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910087661.1/,转载请声明来源钻瓜专利网。
- 上一篇:链路检测方法
- 下一篇:混合动力汽车电机转子定位系统及其定位方法