[发明专利]一种多路服务器CPU隔离方法及系统有效
申请号: | 201910895559.8 | 申请日: | 2019-09-21 |
公开(公告)号: | CN110764829B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 王培培;孔祥涛 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/4401 | 分类号: | G06F9/4401;G06F9/48;G06F9/50 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 刘雪萍 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务器 cpu 隔离 方法 系统 | ||
本发明提供一种多路服务器CPU隔离方法及系统包括如下步骤:操作系统上层应用发送中断信号触发CPU隔离请求;BIOS接收到中断信号后检查CPU的状态信息根据检查结果确认待隔离CPU;BIOS通过南桥芯片的SMLink接口发送待隔离CPU的隔离请求命令给CPLD;CPLD接收到命令后进行隔离处理;BIOS对隔离后的CPU进行检测处理;发送中断请求到操作系统CPU隔离完成。当操作系统发出隔离某个从CPU的请求后,BIOS处理数据,然后通知CPLD拉低相应CPU的复位信号Reset和电源信号PWRGD,使CPU隔离。BIOS检测CPU的隔离情况,最后发送请求告诉操作系统,CPU隔离成功。
技术领域
本发明涉及服务器设计技术领域,具体涉及一种多路服务器CPU隔离方法及系统。
背景技术
随着信息技术的发展,人们生活中很多信息交互都离不开网络,网络中存储数据和处理数据的基础是服务器,而服务器的运算核心是CPU。目前,各种应用程序和应用场景对数据运算量和运算速率的要求越来越高,在关键计算领域,要求单机运行能力强,保密性强等,很多业务处理需要多路CPU服务器完成。
CPU是服务器运行的核心,在多路CPU服务器中,如果有一个CPU发生故障,例如出现UPI报错、CATERR、或者PCIe高速链路中出现RXERR,就会影响数据传输和计算的准确性,可能造成数据传输或计算错误,影响上层程序的正常运行。如果多路服务器,例如4路服务器中,只有一个CPU故障,其他CPU可以正常运行,服务器拿掉这颗CPU后,还可以正常运行应用程序,而此时服务不能中断,无法关机更换CPU,这时就需要把故障CPU隔离。
CPU是大功耗芯片,一般需要200W或者更高,如果运行过程对CPU要求没有那么高,减少一个CPU,依然能保证程序正常运行,为了节省机器功耗,也可以屏蔽CPU,使CPU进入隔离状态,达到节能的目的。如何在断电情况对服务器CPU进行隔离是需要解决的问题。
发明内容
针对多路CPU的服务器进行故障CPU或空闲CPU进行状态隔离的问题,本发明提供一种多路服务器CPU隔离系统及方法。
本发明的技术方案是:
一方面,本发明技术方案提供一种多路服务器CPU隔离方法,包括如下步骤:
操作系统上层应用发送中断信号触发CPU隔离请求;
BIOS接收到中断信号后检查CPU的状态信息根据检查结果确认待隔离CPU;
BIOS通过南桥芯片的SMLink接口发送待隔离CPU的隔离请求命令给CPLD;
CPLD接收到命令后进行隔离处理;
BIOS对隔离后的CPU进行检测处理;
发送中断请求到操作系统CPU隔离完成。
进一步的,所述的操作系统上层应用发送中断信号触发CPU隔离请求的步骤之前包括:
接通电源执行服务器开机过程;
BIOS执行代码引导进入操作系统。
进一步的,所述的接通电源执行服务器开机过程的步骤包括:
接通电源执行上电时序各电源模块输出电源信号;
CPLD检查CPU的在位信息确认是否有要隔离的CPU,若有,保持CPU电源信号、CPU复位信号以及CPU对应的PCIe设备复位信号一直为低电平;
执行步骤:BIOS执行代码引导进入操作系统。
进一步的,若没有需要隔离的CPU,释放CPU电源信号、CPU复位信号以及CPU对应的PCIe设备复位信号,上电完成,执行步骤:BIOS执行代码引导进入操作系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910895559.8/2.html,转载请声明来源钻瓜专利网。