[发明专利]用于处理装置的同步操作的方法和系统无效
申请号: | 201180060127.7 | 申请日: | 2011-12-09 |
公开(公告)号: | CN103262039A | 公开(公告)日: | 2013-08-21 |
发明(设计)人: | 斯科特·哈托格;克莱·泰勒;迈克·曼特;塞巴斯蒂安·努斯鲍姆;雷克斯·麦克拉里;马克·莱瑟;努万·贾亚塞纳;凯文·麦格拉斯;菲利普·J·罗杰斯;托马斯·沃勒 | 申请(专利权)人: | 超威半导体公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48 |
代理公司: | 上海胜康律师事务所 31263 | 代理人: | 李献忠 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 装置 同步 操作 方法 系统 | ||
发明背景
发明领域
本发明大体上是针对计算系统。更具体来说,本发明大体上涉及计算系统内部的处理装置的同步操作。
背景技术
对使用图形处理单元(GPU)来执行一般计算的渴望在最近由于GPU的示例性每单位功率性能和/或成本而变得更加显著。一般来说,GPU的计算能力已以超过对应中央处理单元(CPU)平台的计算能力的速率增长。随着移动计算市场(例如,笔记本计算机、移动智能电话、平板计算机等)和其所必需的支持服务器/企业系统的蓬勃发展,这种增长已被用来提供指定品质的所需用户体验。因此,组合使用CPU和GPU来执行具有数据并行内容的工作量正在成为一项体积技术(volume technology)。
然而,GPU传统上已在约束程序设计环境中执行操作,其可主要用于图形的加速。这些约束由以下事实而引起:GPU并不具有与CPU一样丰富的程序设计生态系统。因此,它们的使用已主要限于二维(2D)和三维(3D)图形以及少数前沿的多媒体应用,这些多媒体应用已被习惯地用于处理图形和视频应用程序设计接口(API)。
随着多厂商支持的OpenCL和DirectCompute标准API和支持工具的出现,GPU在传统应用中的限制已被扩展到传统图形的范围之外。虽然OpenCL和DirectCompute是有希望的开端,但是在创建允许将CPU和GPU组合来像CPU一样流畅地用于大多数程序设计任务的环境和生态系统方面仍存在着许多障碍。
现有的计算系统常常包括多个处理装置。例如,一些计算系统包括在独立芯片上的CPU和GPU(例如,CPU可能位于母板上,而GPU可能位于图形卡上)或在单个芯片封装中的CPU和GPU。然而,这两种布置仍包括与以下各项相关的重大挑战:(i)独立的存储系统、(ii)提供进程之间的服务质量(QoS)保证、(iii)程序设计模型、(iv)编译至多个目标指令集体系结构(ISA)以及(v)有效调度—全部都要同时使功耗降到最小。
例如,离散的芯片布置迫使系统和软件体系结构设计者利用芯片间接口来使每一个处理器存取存储器。虽然这些外部接口(例如,芯片间接口)对用于配合异构型处理器的存储器等待时间和功耗具有负效应,但是独立的存储系统(即,独立的地址空间)和驱动器管理的共享存储器产生开销,所述开销对细粒卸荷(fine grain offload)来说变得不可接受。
假定传统GPU可能不会有效地执行一些计算命令,则所述命令必须在CPU内部执行。必须在CPU上执行命令增加了对CPU的处理负担并且会阻碍总的系统性能。
虽然GPU为计算卸荷提供了极好的机会,但是传统GPU可能并不适合于系统-软件-驱动进程管理,所述系统-软件-驱动进程管理是在一些多处理器环境中执行有效操作所需要的。这些限制会产生若干问题。
实施方案概述
所需要的是允许多个处理装置被用于执行一个进程的改进的方法和系统,其中利用所述处理装置中的每一个的相对强度或可用资源来有效地执行所述进程。
虽然GPU、加速处理单元(APU)以及通用用途的图形处理单元(GPGPU)是这个领域中常用的术语,但是表述“加速处理装置(APD)”被认为是更广义的表述。例如,APD是指硬件和/或软件的任何配合集合,与常规CPU、常规GPU、软件和/或其组合相比,所述任何配合集合以加速方式完成与加速图形处理任务、数据并行任务或嵌套数据并行任务相关的那些功能和计算。
更明确地说,本发明的实施方案提供一种执行第一处理装置和第二处理装置的同步操作的方法。所述方法包括:在所述第一处理装置上执行进程;响应于对所述第一装置上的所述进程的执行已到达串并行边界的确定,使所述进程的执行线程从所述第一处理装置传递至所述第二处理装置;以及在所述第二处理装置上执行所述进程。
以下参照附图详细地描述本发明的额外特征和优点,连同本发明的各种实施方案的结构和操作。应该指出,本发明不限于本文所描述的具体实施方案。本文所提出的这类实施方案仅用于说明性目的。基于本文所包括的教义,一个或多个相关领域的技术人员将会明白额外的实施方案。
附图/图表简述
并入本文并且形成本说明书的一部分的附图示出本发明,并且与描述一起,进一步用于解释本发明的原理并且用于使相关领域技术人员能够制作并使用本发明。以下参照附图描述本发明的各种实施方案,在所述附图中,相似参考数字自始至终用于指示相似元件。
图1A是根据本发明的实施方案的处理系统的说明性方框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超威半导体公司,未经超威半导体公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180060127.7/2.html,转载请声明来源钻瓜专利网。