[发明专利]将计数值分配给在多核处理器上执行的任务有效
申请号: | 201010619567.9 | 申请日: | 2010-12-22 |
公开(公告)号: | CN102110024A | 公开(公告)日: | 2011-06-29 |
发明(设计)人: | C·J·科迈克;N·杜卡 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 毛力 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数值 配给 多核 处理器 执行 任务 | ||
背景技术
典型的现代计算机系统可包括多核处理器,多核处理器包括执行多个线程的一个或多个处理核。相对复杂的软件堆栈可在多核处理器上运行,且因此,诸如绘图调用的给定软件功能可不在处理核集合上串行地执行,而是替代地,该功能通常被分成多个任务,这多个任务在处理核上的多个线程上执行。此外,特定任务何时执行通常本质上不是确定的,因为任何单任务理论上可以被调度程序预清空、从执行中流去除、并稍后重新调度到另一线程和/或核上。
在存在这些复杂性的情况下,分析程序确定诸如高速缓存未命中、执行失速等等的哪些监测性能度量可归因于特定任务、任务组或软件函数是困难的。
附图说明
图1示出根据本发明的实施例的计算机系统的示意图。
图2是描述根据本发明的实施例将计数值分配给在多核处理器上执行的任务的技术的流程图。
图3是根据本发明的实施例在多核处理器上执行的时间交迭任务的图示。
图4是描述根据本发明的实施例根据执行任务的处理核对所选任务进行分类的技术的流程图。
图5A和5B是描述根据本发明的实施例将计数值分配给在处理核上执行的所选任务的技术的流程图。
具体实施方式
参照图1,根据本发明的实施例,多核机器或系统10具有多核图形处理器30,该多核图形处理器30具有多个处理核34。对于此示例,每个处理核34具有用于测量特定性能度量的硬件计数器36(每个核34一个计数器36,如图1所描绘)。例如,给定处理核34可包括用于对高速缓存未命中计数的硬件计数器36、用于对执行失速次数计数的计数器36、用于保持表明执行利用率的计数的计数器36等。应注意,多核图形处理器30仅仅是多核处理器的示例,因为本文所描述的多核处理器可以是除图形处理器之外的多核处理器,诸如作为非限制性示例的单指令多数据(SIMD)多核处理器或系统10的主系统处理器14。
在本文中假定处理核34执行任务,其中任务是用于调度和执行的任何常见工作单元。一般而言,任务可以是代码的的具有开头和结束的任何一部分,且任务的持续时间可被定义为用于执行该任务的多个处理器周期。给定的较高级软件函数(例如图形处理情况下的绘图调用)可调用跨多个处理核34上的许多线程执行的若干任务。
硬件计数器36是核专属的,因此处理核34不具有每线程硬件计数器。替代地,硬件计数器36由在处理核34上运行的各个任务无区分地取样。硬件计数器36与任务之间对应性的缺少可能在确定计数值的哪些部分归因于给定任务时引入问题。例如,特定硬件计数器36可对整个处理核34的高速缓存未命中计数。虽然在处理核34上执行的给定任务可在任务开始和结束时对硬件计数器36取样,但从这些样本中得出的计数值(即计数变化量)不一定表明可归因于该给定任务的高速缓存未命中,因为许多其他交迭的任务在给定任务活动的时间区间期间也会引起高速缓存未命中。
根据本文中所描述的本发明的实施例,系统10执行用于在给定时间周期期间执行的任务之间分配计数值的技术。为简化以下讨论,假定硬件计数器36是高速缓存未命中计数器,其在每次特定高速缓存未命中在核34中发生时由处理核34加1。根据本发明的其他实施例,本文所描述的技术可适用于分配与除高速缓存未命中之外的其他度量相关联的计数值。
参照图2并结合图1,根据本发明的一些实施例,系统10执行技术100,以将计数值的一部分归因于在处理核34上执行的给定任务。该技术100包括在其中多个任务在处理核34上活动的时间段期间提供表示计数值的计数器数据(框104)。该技术100包括确定该计数值可归因于该时间段期间的任务中的给定任务的可能性(框108),并按照框112至少部分地基于所确定的可能性将计数值的一部分归因于给定任务。
参照图1,根据本发明的一些实施例,一般而言,图形处理器30执行用于在显示器40上生成图像的任务,诸如图1所描述的示例性描绘的图形用户界面(GUI)44。GUI 44显示在图形处理器30上执行的任务,并允许用户选择一个或多个任务以进行分析。作为更具体的示例,根据本发明的一些实施例,GUI 44可允许用户使特定的软件函数(绘图调用,作为非限制性示例)突出显示,以选择该函数来进行与该调用相关联的性能度量的分析。所选函数可涉及在图形处理器30上执行的多个任务、可涉及在不同线程上执行的多个任务、且可涉及在不同处理核34上执行的任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010619567.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:便携式铁轨接头感应正火处理装置
- 下一篇:一种干衣机