[实用新型]一种多GPU运算卡有效

专利信息
申请号: 201220580233.X 申请日: 2012-11-06
公开(公告)号: CN203276273U 公开(公告)日: 2013-11-06
发明(设计)人: 郭森;梁永生;张锦雄 申请(专利权)人: 深圳信息职业技术学院
主分类号: G06F15/167 分类号: G06F15/167;G06F13/26
代理公司: 深圳中一专利商标事务所 44237 代理人: 张全文
地址: 518029 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 gpu 运算
【说明书】:

技术领域

实用新型属于计算机技术领域,尤其涉及一种多图形处理器(Graphic Processing Unit,GPU)运算卡。 

背景技术

随着科学技术的飞速发展,个人计算机的性能越来越强大,硬件厂商们为了占领更多的市场份额,纷纷在各自的领域积极推进先进技术。其中,显卡厂商们为了追求极致性能和领先地位,推出了集成两个甚至更多个GPU的多GPU图形运算卡。当在具有多GPU图形运算卡的个人超级计算机上应用统一计算设备架构(Compute Unified Device Architecture,CUDA)或开放的图形程序接口(Open Graphics Library,OpenGL)进行程序开发时,人们常常需要在多个GPU之间进行频繁的数据传递。 

当前,多个GPU间的数据传递技术通常是基于PCIE总线来完成的,这样的实现极大地影响了GPU的处理性能。以具有两个GPU的运算卡为例:当需要将数据从一个GPU的显存传递到另一个GPU的显存时,首先需要将一个GPU显存中的数据通过PCIE总线传递到主机内存中暂存,再通过PCIE总线将数据从主机内存传递到另一个GPU的显存中。由于PCIE总线的带宽仅有2~3GB每秒,而GPU读出显存的带宽可以达到100GB每秒之多,PCIE总线成为了影响多GPU运算卡性能的瓶颈,降低了GPU运算卡的数据处理效率。 

实用新型内容

本实用新型实施例的目的在于提供一种多GPU运算卡,旨在解决现有的GPU运算卡数据处理效率低的问题。 

本实用新型实施例是这样实现的,一种多GPU运算卡,包括至少两个GPU,每个所述GPU分别与各自的GPU显存连接,还包括: 

分别连接每个所述GPU的全局共享内存。 

进一步地,还包括: 

分别连接每个所述GPU以及所述全局共享内存的仲裁电路。 

进一步地,所述全局共享内存位于一个所述GPU显存中。 

进一步地,所述全局共享内存分布于一个以上的所述GPU显存中。 

进一步地,所述全局共享内存包括与每个所述GPU连接的读写接口。 

进一步地,所述仲裁电路包括: 

与所述全局共享内存连接的锁定电路;以及 

与所述全局共享内存连接的解锁电路。 

进一步地,所述仲裁电路包括现场可编程门阵列FPGA仲裁电路。 

本实用新型实施例通过在多GPU之间增加全局共享内存,使得GPU之间的数据传递过程不再受限于PCIE总线来完成,有效利用了显存的带宽,显著提高了多GPU运算卡的数据处理性能。 

附图说明

图1是本实用新型实施例提供的多GPU运算卡的结构框图; 

图2是本实用另一新型实施例提供的多GPU运算卡的结构框图。 

具体实施方式

为了使本实用新型的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本实用新型进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本实用新型,并不用于限定本实用新型。 

本实用新型实施例通过在多GPU之间增加全局共享内存,使得GPU之间的数据传递过程不再受限于PCIE总线来完成,有效利用了显存的带宽,显著 提高了多GPU运算卡的数据处理性能。 

图1示出了本实用新型实施例提供的多GPU运算卡的结构框图,为了便于说明,仅示出了与本实施例相关的部分。 

参照图1,本实用新型实施例提供的多GPU运算卡包括至少两个GPU11,如图1所示,至少包括第一GPU111和第二GPU112,且每个GPU11分别与各自的GPU显存12连接,如图1所示,第一GPU111和第一GPU显存121连接,第二GPU112和第二GPU显存122连接。 

在本实施例的上述结构中,GPU11是多GPU运算卡中的核心部件,用于实现三维图像和特效的渲染处理。具体地,第一GPU111读取第一GPU显存121中的数据并对数据进行运算处理,完成运算后将结果写入第二GPU显存122中,以使第二GPU112读取第二GPU显存122中的数据并对数据进行运算处理,并在处理完成后将结果写回第二GPU显存122中,由此完成一次GPU之间的数据处理与传输。 

在本实用新型实施例中,多GPU运算卡还包括: 

分别连接每个GPU11的全局共享内存13,以及 

分别连接每个GPU11以及全局共享内存13的仲裁电路14。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳信息职业技术学院,未经深圳信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201220580233.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top