[发明专利]GPU并行计算资源配置方法及装置有效
申请号: | 201810885539.8 | 申请日: | 2018-08-06 |
公开(公告)号: | CN109086137B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 宋炎侃;陈颖;于智同;黄少伟;沈沉 | 申请(专利权)人: | 清华四川能源互联网研究院;清华大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/48 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 梁斌 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | gpu 并行 计算 资源配置 方法 装置 | ||
本发明涉及计算机技术领域,具体提供一种GPU并行计算资源配置方法及装置,方法包括:获取一计算流程确定的计算任务,对计算任务采用双层并行计算模型在初始参数下进行处理得到一分层有向无环图模型,根据分层有向无环图模型对计算任务采用双层并行计算模型在多个预设参数下进行处理得到一同构图,根据多个预设参数的数量以及各预设参数对应的计算元的数量得到所需的线程块的数量,并根据预设参数及各预设参数对应的计算元对线程块进行标号,将各预设参数对应的计算元根据各线程块的标号进行分配,以使各线程块对分配到的计算元进行计算。通过上述方法,以有效提高并行计算效率。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种GPU并行计算资源配置方法及装置。
背景技术
随着计算机技术的日新月异,传统CPU设计工艺已经逐渐到触碰物理极限,计算能力的增长速度已经远远落后于“摩尔定律”。计算能力的提高逐步转向于依赖多核、众核等新型并行计算技术上来。近年来,图形处理器GPU作为一种先进的众核异构并行计算设备,开始被广泛应用到加速气候模拟、蛋白质折叠、深度学习等大规模计算密集型任务。以支持NVIDIA CUDA架构的GPU为例,在对计算任务进行处理时,计算任务在被组织为一个或多个包含海量线程的Kernel操作系统内核。一个Kernel内部的线程又被分组为多个线程块(block),每个block内部,以32各线程为一组形成线程束(warp)。在CUDA架构下,计算资源分配的最底层是线程束。
发明人经研究发现,对于海量计算任务,Kernel stream并行在任务级层面仅仅为粗粒度并行,不同Kernel之间并行度有限,实际加速效果较差。特别地,针对流程串行度较高的计算任务(如稀疏矩阵因子分解、稀疏三角方程求解等基于有向图形式的稀疏算法),上述Kernel内部的并行度很低,而Kernel间并行度仍有限,在实际计算中存在大量空置的计算资源,使得实际并行效率很低。因此,提供一种在对计算任务进行处理时能够有效提高计算效率的方法是亟待解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种GPU并行计算资源配置方法及装置,以有效缓解上述技术问题。
为实现上述目的,本发明实施例采用如下技术方案:
一种GPU并行计算资源配置方法,所述方法包括:
获取一计算流程确定的计算任务;
对所述计算任务采用双层并行计算模型在初始参数下进行处理得到一分层有向无环图模型;
根据所述分层有向无环图模型对所述计算任务采用所述双层并行计算模型在多个预设参数下进行处理得到一同构图,其中,所述同构图中包括各所述预设参数分别对应的计算元;
根据所述多个预设参数的数量以及各所述预设参数对应的计算元的数量得到所需的线程块的数量,并根据所述预设参数及各所述预设参数对应的计算元对所述线程块进行标号;
将各所述预设参数对应的计算元根据各所述线程块的标号进行分配,以使各线程块对分配到的计算元进行计算。
可选的,在上述GPU并行计算资源配置方法中,所述双层并行计算模型包括KPN图模型和LDAG计算模型,对所述计算任务采用双层并行计算模型在初始参数下进行处理得到一分层有向无环图模型的步骤包括:
对所述计算任务采用KPN图模型进行处理得到计算流程有向图,其中,所述计算流程有向图包括多个子流程;
对所述计算流程有向图中的各子流程进行分层,得到每个分层对应的子流程;
对所述计算流程有向图中的各分层对应的子流程采用LDAG计算模型进行处理得到各所述分层对应的子流程的计算元,并根据所述计算流程有向图和各所述分层对应的子流程的计算元得到分层有向无环图模型,以及根据所述初始参数得到各计算元对应的基本指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华四川能源互联网研究院;清华大学,未经清华四川能源互联网研究院;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810885539.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种Samba软件的请求处理方法及相关装置
- 下一篇:数据处理方法和系统