[发明专利]在SIMD处理单元中的任务执行有效

专利信息
申请号: 201410788491.0 申请日: 2014-12-17
公开(公告)号: CN104731561A 公开(公告)日: 2015-06-24
发明(设计)人: J·豪森;J·里德肖;Y·C·富 申请(专利权)人: 想象技术有限公司
主分类号: G06F9/38 分类号: G06F9/38
代理公司: 北京市金杜律师事务所 11256 代理人: 王茂华;辛鸣
地址: 英国赫*** 国省代码: 英国;GB
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: simd 处理 单元 中的 任务 执行
【说明书】:

技术领域

发明总体上涉及SIMD处理单元,并且更特别地涉及在SIMD处理单元中的任务执行。

背景技术

单指令多数据(SIMD)处理单元被布置为同时对多个数据项目执行相同操作。这允许SIMD处理单元并行处理数据项目,这可以比串行处理每个数据项目更高效。SIMD处理单元在将对大量数据项目执行相同指令(这在多媒体应用中是常见的)时特别有用。例如,图形处理单元(GPU)可以使用SIMD处理单元以便对计算机生成的图像的大量像素中的每个像素执行操作。相似地,用于处理(例如,由相机捕获的)图像数据的图像处理单元(该图像处理单元可以例如是相机处理流水线的部分)可以使用SIMD处理单元以便对图像的大量像素中的每个像素执行操作。

任务可以由多个“工作项目”形成,其中可以执行任务的工作项目以由此对相应数据项目执行公共指令序列。也就是说,工作项目可以包括将对数据项目执行的指令序列,其中包括将对相应数据项目执行的相同指令序列的一组工作项目被一起分组成任务。每个任务可以包括上至预定最大数目的工作项目。可以在任务中包括的工作项目的最大数目可以在不同系统中变化,但是图1代表可以包括上至三十二个工作项目102的任务100。为了清楚,在图1中标注了工作项目102中的仅一些工作项目。图1也指示了工作项目可以被包括在的在任务内的三十二个不同项目定位(从定位0到定位31)中的一些项目定位。可以并行执行在任务内的不同工作项目,因为它们是将对相应数据项目实施的指令的相应实例。任务100未充满工作项目,并且因此被视为具有“部分空置(residency)”。也就是说,任务100包括少于三十二个工作项目,但是它具有用于三十二个工作项目的容量。在任务100中的在图1中有底纹的定位包括工作项目,而在任务100中的在图1中未被底纹化的定位不包括工作项目。因此,任务100在定位0到16包括用于在SIMD处理单元上执行的十七个工作项目而在定位17到31不包括工作项目。另外,在定位0到6、9、11、15和16的工作项目102是用于由SIMD处理单元执行的有效工作项目。然而,如以下更具体地说明的那样,一些工作项目可能无效,在该情况下,它们将未被SIMD处理单元执行。在定位7、8、10和12到14的工作项目102在图1中所示的示例中是无效工作项目并且被示出为交叉影线。

SIMD处理单元可以包括多个处理通道,每个处理通道被配置为在多个处理周期中的每个处理周期中执行工作项目的指令。图2表示使用SIMD处理单元来处理任务,该SIMD处理单元包括在图2中被表示为200的十六个处理通道。处理通道和处理周期的组合包括工作项目的指令可以在其中被处理的处理“时隙”。在这一情况下,处理周期是时钟周期,并且图2示出了被标注为clk 0、clk 1、clk 2和clk 3的四个时钟周期。来自第一任务(任务100)的前十六个定位中的工作项目的指令被调度为在第一处理周期(clk 0)中跨越十六个处理通道执行;并且来自任务100的接下来十六个定位中的工作项目的指令被调度为在第二处理周期(clk 1)中跨越十六个处理通道执行。在接下来的时钟周期(clk 2和clk 3)中,处理通道被调度为执行来自下一任务的工作项目。在任务具有部分空置时,然后将浪费一些处理时隙,即,将未在那些处理时隙中执行工作项目。这从图2可见,因为任务100未在定位17到31包括工作项目,并且这样在第二时钟周期(clk 1)中将执行来自仅一个工作项目(10216)的指令。因此,十五个处理通道在图2中所示的示例中在时钟周期clk 1期间空闲。另外,如果无效工作项目被调度用于在处理时隙中执行则也浪费该处理时隙因为未处理无效工作项目因此在图2中所示的示例中,处理通道7、8、10、12、13和14在第一处理周期(clk 0)期间空闲,因为工作项目1027、1028、10210、10212、10213和10214在任务100中是无效工作项目。在图2中所示的系统因此出于以上给出的原因而造成浪费的处理时隙。

现代图形应用编程接口(API)(比如OpenGL和Microsoft的DirectX)定义跨越在2x2像素四方格内的像素而进行操作的指令。例如,经常有必要通过“梯度”操作来确定在不同像素之间的可变数量的改变速率。这些指令的存在防止在将工作项目打包成任务时去除(与无效工作项目对应的)“空”像素时隙。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于想象技术有限公司;,未经想象技术有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410788491.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top