[发明专利]失效切换方法、装置和系统有效
申请号: | 201480000478.2 | 申请日: | 2014-03-21 |
公开(公告)号: | CN104170307B | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 王俊捷;王瑞玲;叶岩 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04L1/22 | 分类号: | H04L1/22 |
代理公司: | 北京同立钧成知识产权代理有限公司11205 | 代理人: | 刘芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 失效 切换 方法 装置 系统 | ||
技术领域
本发明涉及通信技术,尤其涉及一种失效切换方法、装置和系统。
背景技术
随着近几年硬件的迅速发展,现有的服务不能充分利用资源,导致资源利用率不高,不能最大化企业的投资回报。为了提高资源利用率,目前业界提出共享输入/输出(Shared Input/Output,Shared IO)技术,即单根输入/输出虚拟化设备(Single-Root I/O Virtualization,SR-IOV)可以在不同的部件快速互连局部总线(Peripheral Component Interconnect Express,PCIe)域间(即不同的物理机上)共享,SR-IOV设备的物理子设备(Physical Function,PF)或者虚拟子设备(Virtual Function,VF)可以绑定到不同的主机(Host)上,和正常使用PCIe设备一样。在Shared IO架构中,全局的PCIe域需要多中央处理器(multiple central processing unit,mCPU)来维护;而且为了提高系统可靠性,mCPU通常设置主mCPU和备mCPU进行主备冗余,当主mCPU宕机后,主mCPU和备mCPU进行失效切换(failover),即备mCPU充当主mCPU,继续处理主机业务。
但是,在备mCPU进行失效切换处理时,通常备mCPU需要重新枚举各PCIe设备,这会导致在失效切换时主机业务的中断;不仅如此,还可能引起更为严重的问题:主mCPU负责根据主机发送的访问PCIe设备的请求去访问PCIe设备,再将访问响应返回主机,如果主mCPU宕机,并且备mCPU不能及时快速的切换,将导致主机的访问请求不能被及时处理,可能会由于访问超时而导致主机宕机,并有可能由于同样的原因导致整个PCIe网络中所有主机的宕机,降低了PCIe网络的可靠性。
发明内容
本发明实施例提供一种失效切换方法、装置和系统,以实现主备处理器的快速切换。
第一方面,提供一种失效切换方法,包括:
第二设备接收用于通知第一设备所处理的主机访问部件快速互连局部总线PCIe设备的事务的事务处理报文,所述事务处理报文携带处理信息,所述处理信息用于描述在所述事务中断时对所述事务进行恢复所需要的信息;所述第二设备还存储所述PCIe设备的拓扑信息,并加载所述PCIe设备的驱动;
所述第二设备在监测到所述第一设备失效时,根据所述拓扑信息、驱动以及所述处理信息,继续处理所述第一设备失效时所述主机访问所述PCIe设备的事务。
结合第一方面,在第一种可能的实现方式中,第二设备接收用于通知第一设备所处理的主机访问部件快速互连局部总线PCIe设备的事务的事务处理报文,所述事务处理报文携带处理信息,包括:所述第二设备接收所述主机访问所述PCIe设备的事务内容、以及所述第一设备同步的所述主机访问所述PCIe设备的事务状态数据,所述处理信息包括所述事务内容和所述事务状态数据。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述事务状态数据包括:事务处理位置标识;所述继续处理所述第一设备失效时所述主机访问所述PCIe设备的事务,包括:所述第二设备根据所述事务处理位置标识确定事务中断位置;所述第二设备从所述事务中断位置处,继续处理中断的所述事务;或者,从所述事务的开始位置处,重新处理中断的所述事务。
结合第一方面的第一种可能的实现方式,在第三种可能的实现方式中,所述事务状态数据包括:事务完成标识;所述第二设备接收事务处理报文之后,还包括:所述第二设备删除与所述事务完成标识对应的处理信息。
结合第一方面至第一方面的第三种可能的实现方式中的任一种,在第四种可能的实现方式中,所述继续处理所述第一设备失效时所述主机访问所述PCIe设备的事务,包括:所述第二设备根据所述拓扑信息查找到所述主机访问的所述PCIe设备,利用所述驱动访问所述PCIe设备,并执行根据所述处理信息得到的在所述第一设备失效时正在处理的事务。
第二方面,提供一种失效切换装置,包括:
接收单元,用于接收用于通知第一设备所处理的主机访问部件快速互连局部总线PCIe设备的事务的事务处理报文,所述事务处理报文携带处理信息,所述处理信息用于描述在所述事务中断时对事务进行恢复所需要的信息;
存储单元,用于存储所述PCIe设备的拓扑信息,以及加载的所述PCIe设备的驱动;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480000478.2/2.html,转载请声明来源钻瓜专利网。