[发明专利]用于性能改善的可重配置图形处理器在审
申请号: | 201180074955.6 | 申请日: | 2011-11-21 |
公开(公告)号: | CN103959196A | 公开(公告)日: | 2014-07-30 |
发明(设计)人: | N·卡布拉塞斯;E·C·萨姆森 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F1/26 | 分类号: | G06F1/26;G06F9/44;G06F9/305 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 姬利永 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 性能 改善 配置 图形 处理器 | ||
背景
本申请总体上涉及计算机系统中的图形处理。
图形处理器在不同的处理条件下运行。在一些情况下,它们可在高功耗模式下以及在低功耗模式下运行。可能令人期望的是,在给定图形处理器所运行的功耗模式的情况下,获得最大的可能性能。
附图简要说明
图1是本发明的一个实施例的框图。
图2是本发明的另一个实施例的流程图。
图3是本发明的一个实施例的示意图描绘。
图4是本发明的一个实施例的性能相对于功率预算的假想图;以及
图5是一个实施例的功率预算相对于时间的假想图。
详细说明
在一些实施例中,图形处理内核自动对其自身进行重配置以便通过对图形处理引擎的部分进行动态功率门控来在高功率和低功率包络中增加或最大化性能。如在此所使用的,功率门控包括激活或去激活内核部分。
尽管将使用平板计算机图形处理器提供示例,相同的概念应用于任何图形处理器。
图形处理内核通常包括执行算数、逻辑和其他操作的多个执行单元。可使用多个采样器进行纹理处理。采样器和多个执行单元是子切片(subslice)。可基于目标性能和功率预算在特定的图形处理内核中包括多个子切片。对子切片进行组合以形成图形处理切片(slice)。图形处理内核可包含一个或多个切片。在平板计算机图形处理内核中,通常使用单个切片以及一个、两个或三个子切片设计。多切片在客户端图形处理器中是常见的。
因此,参见图1,示出了典型的图形处理器内核,内核10包括切片编号1(标记为14),该切片可包括固定功能流水线逻辑16和多个子切片18a和18b。在一些实施例中,可包括更多切片和更多或更少的子切片。图形处理内核还包括固定功能逻辑12。
一个、两个和三个子切片设计的功率和性能特征不同,如图4所示。作为一个示例,性能线性地增加到性能相对于功率耗散的拐点A(例如,大约2.5瓦)。在该拐点以下,图形处理器在频率成比例的区域中工作,在该区域中,可在不升高工作电压的情况下升高图形处理器频率。在该拐点以上,图形处理器频率仅在电压也升高时才升高,这通常对功率耗散具有负面影响并且导致性能相对于功率耗散中比频率成比例区域经历更平缓的曲线。
可对图形处理器的子切片中的一个或多个进行功率门控。总体上,子切片越多,性能越高,但是性能间隙随着可用功率预算的减少而减少并且可能在图4中存在点B(例如,在大约1.5瓦),其中单一子切片配置表现得比两子切片配置更好。这种更优性能是由具有明显更多泄露功率以及因此更少用于动态功率的空间的更大配置造成的。在低功率预算中,更少用于动态功率的空间可显著地限制更大配置的频率和性能,使得其看起来没有更小配置那么吸引人。
在一些实施例中,功率共享机制可用于实现图形处理器子切片的高效动态功率门控。当然,代替对子切片功耗进行门控,相同的概念应用于具有多于一个切片的实施例中的任意数量的图形处理器切片的动态功率门控。
图形处理器可具有功率共享功能,该功能基本上随着时间增加(或降低)功率,如图5所示。在特定的时间点t1处,可由功率控制单元为图形处理器内核分配特定低水平的功率预算TDP1,该功率预算迫使图形处理器在特定频率f1下运行,该特定频率是允许图形处理器不超过其分配功率预算的最大频率。当功率预算随着时间增加时,图形内核可在逐渐更高的频率下运行。
在子切片功率门控下,功率控制单元事先得知图形处理器内核可配置有全套的执行单元和子切片或者配置有更少的执行单元和子切片。例如,一个实施例可包括十六个执行单元和两个子切片并且另一种操作模式可包括八个执行单元和一个子切片。当图形处理器可用的功率预算很小时,可在更小的内核配置中配置图形处理器,其中两个可用子切片之一被功率门控。
总体而言,不是简单地在任何特定时间点关闭子切片,因为其可能正在执行有效线程。当功率控制单元确定应当对子切片进行功率门控时,立即动作是阻挡新的图形处理线程被调度到该子切片上。因此,在已经在子切片上执行的线程完成并且子切片变为空闲之前需要一段时间。在一个实施例中,仅当这时对子切片进行实际功率门控。
在功率门控下,当功率预算逐渐增加时,在某一时间点,初始关闭的子切片变为打开。或者,相反地,当处理器从高功率预算变为低功率预算时,可关闭子切片(如图5所示)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180074955.6/2.html,转载请声明来源钻瓜专利网。