[发明专利]一种防止服务器过流掉电的方法及系统有效
申请号: | 202010058630.X | 申请日: | 2020-01-19 |
公开(公告)号: | CN111290560B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 刘栋;董超 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F1/30 | 分类号: | G06F1/30;G06F1/28;G06F11/30;G06T1/20 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 李修杰 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 防止 服务器 流掉 方法 系统 | ||
本申请公开了一种防止服务器过流掉电的方法及系统,该方法包括:获取服务器中所有GPU的实时功率,并按照功率从大到小的顺序排序,同时还获取服务器中PSU电源的实时功率,然后判断PSU电源的实时功率是否临近PSU电源的极限功耗,当PSU电源的实时功耗达到极限功耗范围时,根据PSU电源的实时功率和GPU的实时功率排序结果,逐步控制GPU执行Power Brake操作,直到PSU电源的实时功率处于安全基线以下。该系统包括:GPU实时功率获取模块、排序模块、PSU电源实时功率获取模块、判断模块和Power Brake控制模块。通过本申请能够有效节省资源,并有利于提高服务器运行的稳定性。
技术领域
本申请涉及(Artificial Intelligence,人工智能)服务器技术领域,特别是涉及一种防止服务器过流掉电的方法及系统。
背景技术
随着人工智能技术的发展,对服务器的性能提出了更高的要求。AI服务器高性能的体现之一即为超高算力。在服务器中最常见的算力提供方式是采用大规模的GPU集群,随时服务器整体算力的提升,导致GPU(Graphics Processing Unit,图形处理器)的功率在不断提升,进而导致整个AI服务器的功率不断提升,而AI服务器较高的功率又容易导致整机过流掉电问题。因此,如果防止AI服务器过流掉电,AI服务器技术领域一个重要的技术问题。
目前,防止AI服务器过流掉电的方法,通常有两种方法。第一种是:根据GPU的EDPP(electrical date peak processing,供电数据峰值处理)功率对PSU(Power SupplyUnit,电源供应器模块)进行选型,确保所有的GPU同时工作在EDPP状态时,整机功率依然低于PSU功率。第二种是对整机功率进行监控,当整机功率临近PSU的极限时,同时对所有GPU执行降频操作,从而快速大幅度降低整机总功率。
然而,目前第一种防止AI服务器过流掉电的方法中,由于不同GPU同时处于EDPP状态的概率很低,采用高功率PSU对服务器系统的整体配置要求较高,会导致资源浪费严重。第二种防止AI服务器过流掉电的方法中,由于同时对所有GPU执行降频操作,导致各GPU正在处理的内容立即被中断,从而导致整机性能瞬间降低,进而导致AI服务器的稳定性较差。
发明内容
本申请提供了一种防止服务器过流掉电的方法及系统,以解决现有技术中防止服务器过流掉电的方法导致资源浪费以及整机稳定性较差的问题。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
一种防止服务器过流掉电的方法,所述服务器中GPU的数量为N,所述方法包括:
S1:获取所述服务器中所有GPU的实时功率;
S2:按照功率从大到小的顺序,对所有GPU的实时功率进行排序;
S3:获取服务器中PSU电源的实时功率;
S4:判断所述PSU电源的实时功率是否满足:A*PSU电源的最大功率≤PSU电源的实时功率≤PSU电源的最大功率,其中,A为比例系数,A*PSU电源的最大功率为PSU保持长时间正常运行所能承受的最大功率;
S5:如果是,根据PSU电源的实时功率和所有GPU的实时功率排序结果,逐步控制GPU执行Power Brake操作,直到服务器的功率满足:PSU电源的实时功率<A*PSU电源的最大功率为止,其中,N为自然数且N≥2。
可选地,比例系数A根据PSU电源的电压和额定功率确定。
可选地,所述根据PSU电源的实时功率和所有GPU的实时功率排序结果,逐步控制GPU执行Power Brake操作的方法,包括:
S51:实时功率最大的GPU执行Power Brake操作;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010058630.X/2.html,转载请声明来源钻瓜专利网。