[发明专利]一种LockStep处理机及管理方法有效
申请号: | 201611153880.1 | 申请日: | 2016-12-14 |
公开(公告)号: | CN108228391B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 徐奡;刘帅;周啸;郑久寿;李鹏;夏德天 | 申请(专利权)人: | 中国航空工业集团公司西安航空计算技术研究所 |
主分类号: | G06F11/16 | 分类号: | G06F11/16;G06F11/20 |
代理公司: | 中国航空专利中心 11008 | 代理人: | 杜永保 |
地址: | 710000 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于计算机系统可靠性设计技术,涉及一种实时监测故障并实时故障恢复的高可靠多处理器计算机架构。包括处理器系统采用单模块设计,包括处理器单元、存储器单元、供电管理单元、时钟单元、系统管理单元;所述处理器单元包含3个并行工作的相似或非相似的处理器CPU;所述存储器单元由3个并行工作的随机存储器RAM、2个主备工作只读存储器ROM以及1个非易失存储器NVM组成;所述供电管理单元实现系统双余度供电的监控与管理以及系统二次电源的转换与管理;所述时钟单元实现双余度时钟电路的监控与管理;所述系统管理单元负责监控系统资源的工作情况,针对资源的故障进行定位、隔离与恢复。 | ||
搜索关键词: | 一种 lockstep 处理机 管理 方法 | ||
【主权项】:
1.一种LockStep处理机的管理方法,其特征在于:包括正常、降级、停机3种工作模态;(1)正常模态下,处理器系统中的3个处理器CPU锁步运行,在处理器前端总线上同步处理器总线周期操作如读取,写入等,以及对处理器系统内存RAM数据进行同步操作如读取、写入;处理器总线周期操作和内存数据的同步操作通过系统管理单元FPGA实现并对数据进行多数表决,如果通过表决可以得到表决值,则实际操作数据采用表决后的同一值。如果通过表决未得到表决值,说明发生1:1:1的奇异故障,处理器系统进入故障停机模态;处理器系统针对每个冗余CPU及RAM设置故障计数器;(2)对于Lockstep处理机中的CPU,若其总线周期操作数据与表决值不一致连续累计次数超过门限,则认为该CPU运行故障,系统管理单元中的复位系统将复位该故障CPU,复位完成后故障CPU根据复位前系统存储于RAM中上下文进行重同步操作,重同步成功后系统继续按照表决策略运行。当故障CPU处于复位恢复过程或无法成功恢复情况下,处理器系统进入降级模态,剩余的两个CPU采用比较工作模式,2模Lockstep处理机主控监控架构,在该模式下一旦发生不一致则系统进入故障静默状态即停机模态;(3)对于RAM,若某个RAM读取数据与表决值不一致次数超过门限,系统管理单元将根据另外2个RAM表决内容对故障RAM进行刷新操作。刷新操作成功完成后继续按照表决策略运行;故障RAM刷新过程中或无法成功刷新情况下,处理器系统进入降级模态,剩余RAM采用比较工作模式,在该模式下一旦发生不一致则系统进入故障静默状态即停机模态。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空工业集团公司西安航空计算技术研究所,未经中国航空工业集团公司西安航空计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611153880.1/,转载请声明来源钻瓜专利网。