[发明专利]一种基于温度感知的动态负载调度方法及系统在审
申请号: | 202210069077.9 | 申请日: | 2022-01-21 |
公开(公告)号: | CN114398181A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 贺鹏;王金辉;肖义 | 申请(专利权)人: | 上海天数智芯半导体有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F1/20;G06F11/30 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 徐燕 |
地址: | 201100 上海市闵行*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 温度 感知 动态 负载 调度 方法 系统 | ||
本发明公开了一种基于温度感知的动态负载调度方法及系统。本发明用于实现高性能计算芯片多计算引擎间的动态温度平衡。对于多计算引擎分区进行温度监控,确定权重,计算引擎任务调度器根据权重大小,决定任务分发到那个计算引擎进行运算。依据温度低,权重大,分发任务频度高的原则,让温度较低的计算引擎相对运行较多的任务,温度较高的计算引擎运行相对较少的任务,实现温度平衡。减少由于任务分发导致的局部计算引擎温度过热,出现局部温度异常导致的芯片烧毁,加速老化,或者由于温度异常处理导致的性能下降等问题。
技术领域
本发明涉及芯片温度控制技术领域,特别涉及一种基于温度感知的动态负载调度方法及系统。
背景技术
PCIe板卡正常的温度控制,频率和负载都在正常范围内,一旦由于超频或者负载超重导致芯片最大温度超越正常范围,进入异常状态,用于主动散热或者被动散热的风冷或者水冷无法处理这种情形,通常这种情况下的异常处理,可以交给上层软件,当收到温度异常中断时,然后全面停发任务,从而达到减轻负载的作用,但是会导致计算引擎整体性能的大幅下降。根据对于温度分布的观测,往往芯片在运行的时候,最大温度出现在某些固定的区域,多个计算引擎的任务调度,由于不考虑各个计算引擎的温度差异情况,由于任务量不完全相同和分配算法的某些规律,有时会出现某个计算引擎任务较重的情况,导致计算引擎局部温度升高,超越阈值。
发明内容
本发明针对现有技术中的不足,提供一种基于温度感知的动态负载调度方法及系统;实现了基于温度平衡的任务调度,在保证芯片温度安全的前提下,实现多计算引擎间的动态温度平衡,减少由于出现异常温度导致的芯片烧毁,加速老化,或者由于温度异常处理导致的性能下降等问题。
为实现上述目的,本发明采用以下技术方案:
一种基于温度感知的动态负载调度方法,包括:
S1:根据芯片计算引擎进行分区,每个区域对应一个计算引擎,在每个计算引擎上分散布局温度传感器,温度传感器定期采集芯片各个计算引擎的温度数据后传输给温度传感控制器;
S2:温度传感控制器将收集的温度数据进行预定义转换得到各个计算引擎的温度信息,并统计得出各个计算引擎的温度最大值Tmax后传输给温度比较器;
S3:温度比较器将各个计算引擎的温度最大值Tmax与预先设定的温度阀值Tprochot进行比较,并将比较的结果传输给计算引擎权重产生器;
S4:计算引擎权重产生器根据比较的结果选定各个计算引擎的任务权重;
S5:计算引擎任务调度器按照各个计算引擎的任务权重大小,进行计算任务分发;其中任务权重越大,分发给对应计算引擎的频度越高。
为优化上述技术方案,采取的具体措施还包括:
进一步地,步骤S4中所述计算引擎权重产生器根据比较的结果选定各个计算引擎的任务权重的具体内容为:
若该计算引擎的温度最大值Tmax大于预先设定的温度阀值Tprochot,则设定该计算引擎的任务权重为0;
若该计算引擎的温度最大值Tmax小于预先设定的温度阀值Tprochot,则根据两者的差值设定任务权重,差值越高,该计算引擎的任务权重越大;
统计各个计算引擎的任务权重并进行由大到小的排序然后传输给计算引擎任务调度器。
进一步地,步骤S5中,若其中有计算引擎的任务权重为0时,任务调度器停止分发任务到当前的计算引擎中。
进一步地,一种基于温度感知的动态负载调度系统,包括多组温度传感器、温度传感控制器、温度比较器、计算引擎权重产生器、计算引擎任务调度器;
多组温度传感器,用于分散布局在芯片的各个计算引擎中,并定期采集芯片各个计算引擎的温度数据后传输给温度传感控制器;
温度传感控制器,用于将收集的温度数据进行预定义转换得到各个计算引擎的温度信息,并统计得出各个计算引擎的温度最大值Tmax后传输给温度比较器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海天数智芯半导体有限公司,未经上海天数智芯半导体有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210069077.9/2.html,转载请声明来源钻瓜专利网。