[发明专利]一种面向关键应用的仲裁系统及方法无效
申请号: | 201410377840.X | 申请日: | 2014-08-01 |
公开(公告)号: | CN104133744A | 公开(公告)日: | 2014-11-05 |
发明(设计)人: | 周恒钊;刘璧怡 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | G06F11/16 | 分类号: | G06F11/16 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王丹;李丹 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 关键 应用 仲裁 系统 方法 | ||
技术领域
本发明属于系统仲裁技术领域,涉及一种面向关键应用的仲裁系统及方法。
背景技术
作为提高计算机系统可用性的重要手段,容错的含义是指在系统内部出现故障的情况下,计算机仍然能正确地执行指定算法。容错计算机系统是通过冗余来实现的,当系统中节点出现故障时,系统能够迅速发现故障节点并且将服务切换到其他节点上。在容错计算机系统中,仲裁机制发现故障、诊断故障、系统重构的性能好坏直接影响容错计算机系统的可用性。也就是说一旦计算机出现故障,系统能否及时发现,作出正确的诊断并采取相应的动作是影响系统可用性的关键。传统容错计算机一般采用心跳机制检测对方的状态,一旦本机在约定的时间内收不到对方的心跳,则认为对方出现错误,从而将对方的服务切换过来。这种一对一的仲裁机制实现简单,但是当心跳出现故障而机器一切正常时,双方都认为对方出现了错误,此时系统发生混乱,同时也会造成不必要的切换,增加了切换开销,降低了系统的可用性。因此研究容错计算机系统的仲裁机制显得尤为重要。
发明内容
本发明所要解决的技术问题是,提供一种面向关键应用的仲裁系统及方法,以解决传统仲裁机制故障覆盖率和故障诊断成功率低的问题。
为了解决上述技术问题,本发明公开了一种面向关键应用的仲裁系统,至少包括自检测模块、心跳检测模块和仲裁管理模块,其中:
自检测模块,利用系统自带的检测机制及故障检测算法,检测本节点的主机系统的自身故障,并将检测到的故障信息传送给所述仲裁管理模块;
心跳检测模块,检测对端节点的状态信息,并检测到的其他节点的故障信息传送给所述仲裁管理模块;
仲裁管理模块,根据所述自检测模块和心跳检测模块传送的故障信息,通过自身的仲裁算法对双机节点进行最终的表决。
可选地,上述仲裁系统中,所述仲裁管理模块包括运行在节点主机上的仲裁处理单元和运行在仲裁板上的仲裁子系统,其中:
仲裁处理单元,接收节点主机发起的仲裁请求并转发给所述仲裁子系统,接收所述自检测模块和心跳检测模块传送的故障信息并转发给所述仲裁子系统,以及按照仲裁子系统的指示,调用对应的仲裁算法,根据所述故障信息进行运算,并将运算结果转发给所述仲裁子系统;
仲裁子系统,接收到所述仲裁请求后,根据接收到的故障信息从仲裁算法库中选择的对应仲裁算法,并指示所述仲裁处理按照所选择的仲裁算法进行仲裁运算,以及按照所述仲裁处理模块发送的运算结果确定双机节点的最终表决结果。
可选地,上述仲裁系统中,所述仲裁处理单元包括:
仲裁处理器,驱动节点主机与仲裁板之间的通信,接收节点主机发起的仲裁请求并转发给所述仲裁子系统,接收所述自检测模块和心跳检测模块传送的故障信息并转发给所述仲裁子系统;
仲裁控制子模块,按照仲裁子系统的指示,调用对应的仲裁算法,根据所述故障信息进行运算,并将运算结果转发给所述仲裁子系统。
可选地,上述仲裁系统中,所述仲裁控制子模块采用三模表决法。
可选地,上述仲裁系统中,所述自检测模块,检测本节点的主机系统的自身故障指:
检测本节点的主机系统的硬件和服务进程故障。
本发明还公开了一种面向关键应用的仲裁方法,该方法包括:
利用系统自带的检测机制及故障检测算法,检测本节点的主机系统的自身故障;
检测对端节点的故障信息;
根据所检测到的本节点的主机系统的自身故障以及对端节点的故障信息,通过自身的仲裁算法对双机节点进行最终的表决。
可选地,上述方法中,根据所检测到的本节点的主机系统的自身故障以及对端节点的故障信息,通过自身的仲裁算法对双机节点进行最终的表决指:
接收节点主机发起的仲裁请求时,根据所检测到的本节点的主机系统的自身故障以及对端节点的故障信息从仲裁算法库中选择的对应仲裁算法;
调用所选择的仲裁算法,对检测到的本节点的主机系统的自身故障以及对端节点的故障信息进行运算,按照运算结果确定双机节点的最终表决结果。
可选地,上述方法中,对检测到的本节点的主机系统的自身故障以及对端节点的故障信息进行运算后,再次进行三模表决以确定双机节点的最终表决结果。
可选地,上述方法中,检测本节点的主机系统的自身故障指:
检测本节点的主机系统的硬件和服务进程故障。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410377840.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种有源滤波系统中CAN总线数据传输的方法
- 下一篇:一种页面切换方法