[发明专利]运算和控制单元、运算和控制方法、与并行处理器有效
申请号: | 201210252648.9 | 申请日: | 2012-07-20 |
公开(公告)号: | CN102890625B | 公开(公告)日: | 2017-03-01 |
发明(设计)人: | 京昭伦 | 申请(专利权)人: | 瑞萨电子株式会社 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F9/30 |
代理公司: | 中原信达知识产权代理有限责任公司11219 | 代理人: | 李兰,孙志湧 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运算 控制 单元 方法 并行 处理器 | ||
相关申请的交叉引用
于2011年7月20日提交的日本专利申请No.2011-159396的公开内容,包括说明书、附图和摘要,通过引用其整体而合并于此。
技术领域
本发明涉及并行处理器的运算和控制技术。
背景技术
近些年来,因为需要抑制处理器发热,存在明显的趋势:通过增加进行并行处理的处理器核(以下仅称为“核”)的数量而不是增大处理器的操作频率来实现性能上的改善。其中每一个具有多个核的处理器被称为“多核处理器”,并且,在多核处理器中,其中每一个具有特别大量的核的处理器被称为“众核处理器”。在本说明书中,在多核处理器和众核处理器之间不特别区分,并且其中每一个具有并行进行处理的多个核的处理器通常被称为“并行处理器”。
并行处理器已经在大量的领域中被用作加速器。然而,已经取决于制造商或领域而制造了多种加速器,并且也已经不同地开发了用于加速器的语言和框架。这使得难以在加速器之间移植程序代码。
为了解决这个问题,将OpenCL(开放计算语言)确定为用于并行处理器的标准框架(OpenCL规范,版本:1.0,修订文件:43,Khronos OpenCL工作组(2009))。将描述OpenCL的概览。
图19图示了典型的OpenCL系统的平台模型,其中,对于“OpenCL规范,版本:1.0,修订文件:43,Khronos OpenCL工作组(2009)”中的图3.1添加了附图标号。
如图19中所示,OpenCL系统10包括主机12和一个或多个计算设备(以下称为“OpenCL设备”)14。OpenCL设备14对应于上述的加速器。
OpenCL设备14的每一个具有一个或多个计算单元(以下称为“CU”)16,并且CU16的每一个具有一个或多个处理元件(以下称为“PE”)18。PE18对应于上述的核。
OpenCL的应用包括在主机12侧运行的程序代码和在OpenCL设备14中、即在加速器侧运行的程序代码。在主机12侧运行的程序代码被称为“主机代码”,并且在OpenCL设备14侧运行的程序代码被称为“内核”。
主机12调用用于运算的指令的API(应用程序接口)。OpenCL设备14的每一个执行所指令的运算。主机12产生用于管理资源的环境,并且也产生用于通过OpenCL来调整设备操作的命令队列。“设备操作”包括运算、存储器的操作以及同步。
在OpenCL中,在N维索引空间(1≤N≤3)中执行内核作为工作项目(以下简称为“项目”)。例如,如果将(4,6)被指定为二维索引空间,则总共执行4×6、24个项目。
将一个PE用于一个项目的执行。因此,如果要并行执行的项目的数量与对于该项目实际上存在的PE的数量相同,则总共在4×6、24个PE上执行该内核。
如果存在的PE的数量小于要并行执行的项目的数量,则在存在的PE上重复该项目的并行执行。如果例如仅存在总共2×3、6个PE,则当指定上述的(4,6)的索引空间时,必须通过6个PE将6个项目的并行执行重复4次。
而且,在OpenCL中,引入工作组的概念。工作组是在同一CU 16上执行并且彼此相关联的项目的集合。在同一工作组内的相应的项目执行同一内核,并且共享CU 16的本地存储器,这将在下文描述。
向相应的工作组分配唯一的组ID,并且在每一个工作组内的项目具有在工作组内向其分配的唯一的本地ID。也向项目分配唯一的全局ID。可以通过全局ID或组ID与本地ID的组合来识别项目。
通过以下面的步骤顺序调用API来配置用于允许OpenCL设备14进行运算处理的过程。
<步骤1>:从OpenCL设备14的主机12传送用于运算处理的参考数据(以下称为“参考数据”)和内核。
<步骤2>:响应于“内核开始命令”在OpenCL设备14的每一个上开始执行内核。
<步骤3>:在OpenCL设备14中完成内核的执行后,将运算处理的结果数据从OpenCL设备14的存储器空间传送到主机12侧。
将参考图20来描述包括存储器空间的OpenCL设备14的配置。在图20中,对于“OpenCL规范,版本:1.0,修订文件:43,KhronosOpenCL工作组(2009)”中的图3.3添加了附图标号。如上所述,OpenCL设备14的每一个包括一个或多个CU 16,并且CU 16的每一个具有一个或多个PE 18。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞萨电子株式会社,未经瑞萨电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210252648.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高压电缆头中间芯线的处理方法
- 下一篇:一种管状母线等电位作业的方法