[发明专利]在CPU-GPU异构框架下遍历固定半径内邻居的自适应并行方法有效

专利信息
申请号: 201510800081.8 申请日: 2015-11-19
公开(公告)号: CN105468439B 公开(公告)日: 2019-03-01
发明(设计)人: 阮骥鸣;王长波;秦洪 申请(专利权)人: 华东师范大学
主分类号: G06F9/46 分类号: G06F9/46;G06F9/50
代理公司: 上海蓝迪专利商标事务所(普通合伙) 31215 代理人: 徐筱梅;张翔
地址: 200241 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: cpu gpu 框架 遍历 固定 半径 邻居 自适应 并行 算法
【说明书】:

发明公开了一种在CPU‑GPU异构框架下遍历固定半径内邻居的自适应并行方法,该方法中使用了一个新的并行模型从而让GPU的各种特性能够和问题本身的性质相契合。该方法首先引入自适应并行的概念来对GPU中各个线程进行重组,从而让物理上相邻的线程能够处理逻辑上相似的工作,这样GPU中的很多局部性特征能够得到利用。其次,使用了CPU‑GPU异构框架,让CPU协同处理一些由于使用自适应并行产生的一些对于GPU来说低效率的事务。为了显示出本发明的特点,其被运用到光滑了粒子流体动力学方法(SPH)上并跟现有方法进行了对比,并在处理大规模高密度粒子的问题上体现出了很大的优势。

技术领域

本发明属于高性能计算领域,具体地说是一种基于自适应并行方法在CPU-GPU异构框架下的新的遍历固定半径内邻居的并行方法,涉及到SIMD架构,GPU硬件特性,异构平台下的任务调度与负载均衡,数据交互策略,计算机图形学以及仿真等。

背景技术

FNN问题是处理在多维度欧几里德空间中,所有在给定距离内的点与点之间的交互的问题。而固定网格方法是其中最被广泛使用的方法,特别是在数值方法中。这个方法广泛应用于自然环境的模拟,生物仿真,行为模拟以及三维重建。通过这个方法,可以将构建邻居信息的时间复杂度降到O(wn)(如果使用不基于比较的排序方法),而遍历邻居的时间复杂度降为O(3kwnN),其中w是排序关键字长度,n是空间中点的数量,k是空间维度,N是每一个单元格中点的数量的上限。

为了提升上述方法的性能,一个可行的方案是在多核处理器,特别是诸如GPU这种SIMD加速器上来实现上述方法。由于这个方法非常适合并行化,因此在GPU上已经有了一些针对这个方法比较成熟的并行模型。并且这些传统的并行模型能够在点密度比较低的情况下得到非常好的性能。在传统并行模型中,GPU内核程序的线程网格中所包含的线程数量是和空间中点的数量是相同的。然后这些线程被直接划分为包含线程数量相同的几个线程块,然后在GPU中以这些线程块为单位进行调度运算。每个线程所作的工作就是读取它们所负责的那一个点的一个邻居点的信息然后做一些运算,如此循环直到所有邻居都访问到了。每个线程块的工作就是读取其所负责的所有点的所有邻居,并做相应的运算。

然而,随着点密度的提升,传统的并行模型的性能下降得非常厉害。这是由于传统方法会带来一个线程块中的不同线程的负载不均衡以及内存访问的不一致。这是由于这种简单的线程划分策略导致的:一个线程块内的线程所负责的点往往会分布在几个不同的单元格中,而不同单元格中的点的邻居以及邻接单元格中点的数量都是不一致的,从而导致串行化的内存访问以和分支的产生。并且由于这种不一致性,很难利用GPU中的层次线程和存储单元的特性。图1就展示了传统并行模式下的状况,其中网格块是代表了在当前循环中有点正在被访问的单元格,虚线方块是已经被访问过的单元格,c是一个线程块所负责点所分布的单元格的数量,这个迭代循环会持续1次,其中nc是邻接单元格的数量,npij是线程块内第j个单元格的第i个邻接单元格中点的数量。

另一方面,随着GPGPU技术的不断发展,在一些诸如CUDA和OpenCL这些主流的GPGPU平台上,自适应并行技术(在这些主流平台上被称为动态并行)被逐渐得到支持。而这个技术能够使得计算资源按需分配。从而避免了上一段所说的对计算和存储资源的浪费,从而增加了系统的并行效率。

同时,目前主流的主机往往配备有CPU和GPU。传统的并行模型往往会利用主机中最适合的处理器(CPU或GPU)来计算某个指定问题,而其他设备则闲置了,这是对计算资源的浪费。而针对固定网格方法来处理固定半径内的邻居问题,特别是在GPGPU的出现开始,往往只交给GPU来处理。尽管CPU在处理这个问题方面性能不及GPU,但是合理利用CPU的计算资源来协助GPU还是一项非常有意义的工作。

发明内容

本发明的目的是提供一种在CPU-GPU异构框架下遍历固定半径内邻居的自适应并行方法,该方法在于充分利用主流单节点主机的所有计算能力,来更快速地用基于固定网格方法来处理FNN问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510800081.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top