[发明专利]气体动理论统一算法中的CPU+GPU异构并行优化方法有效
申请号: | 202010751046.2 | 申请日: | 2020-07-30 |
公开(公告)号: | CN111858066B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 李志辉;张子彬;彭傲平;白智勇;徐金秀;吴俊林;蒋新宇 | 申请(专利权)人: | 中国空气动力研究与发展中心超高速空气动力研究所 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F11/34;G06F30/15;G06F30/20 |
代理公司: | 北京远大卓悦知识产权代理有限公司 11369 | 代理人: | 贾晓燕 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 气体 理论 统一 算法 中的 cpu gpu 并行 优化 方法 | ||
1.一种气体动理论统一算法中的CPU+GPU异构并行优化方法,其特征在于,包括CPU+GPU异构并行的实现以及优化;
其中,所述CPU+GPU异构并行的实现是在原有MPI并行程序的基础上,将六层嵌套循环分别以速度矢量信息和空间位置坐标为线索分配给CPU和GPU设备,从而将原有MPI并行程序三个维度的并行,扩展为六个维度的并行;
所述CPU+GPU异构并行的优化方法包括:
S1、基于Boltzmann方程统一算法的并行运行流程和热点代码,对CPU消耗时间进行统计;
S2、基于Boltzmann模型方程统一算法的数据结构和变量使用情况,对各存储器的使用情况进行统计;
S3、基于Boltzmann模型方程统一算法并行计算得到对应的变量依赖关系;
S4、基于Boltzmann模型方程统一算法并行计算的CPU消耗时间、存储器配置、变量依赖关系,通过系统、算法、语句三种级别对CPU+GPU异构并行的Boltzmann模型方程统一算法进行并行优化;
在S3中,变量依赖关系是基于大规模并行的参数作为并行线索,以此设计线程映射方案;
其中,所述映射方案的建立包括:
S31、基于MPI+CUDA软件架构的并行程序,将主程序进行任务拆分,并将拆分后的任务通过MPI分配至多个CPU线程;
S32、各线程进一步将任务拆分为多个子任务,基于CUDA架构将子任务分配到各GPU线程开始并行计算;
在S4中,系统级别的优化被配置为包括分别对数据传输、内存使用的优化;
数据传输的优化被配置为包括:
减少数据传输次数,其是通过对程序的输入数据进行甄别和筛选,分层次进行数据传输,以减少每次数据输入的数量;
减少输入数组中的部分元素,其是通过将大数组降维处理成为小数组,以提升GPU显存的使用效率;
内存使用的优化被配置为包括:
根据参数特点分配内存,其是基于存储器的使用情况统计,对热点代码中调用次数和修改次数很多的数据,放入私有或是共享存储器中;对于调用次数多但是没有修改的数据,放入常量存储器中;调用和修改次数不多的数据,保留在全局存储器中;
减少数组内存的申请次数,其是基于GPU核函数可变数组的最大使用需求,将申请的内存长期赋予这些可变数组;
在S4中,对算法级别的优化是在原有的MPI模式并行离散速度空间基础上,将每个计算节点的CPU将位置空间计算分配给CUDA架构的GPU设备;
在S4中,所述语句级别的优化被配置为包括:
循环合并,其是将热点代码中的部分循环进行合并处理;
循环拆分,其是将子程序中的一个归约运算拆分成多个归约运算进行并行处理;
指令优化,其是将延迟高、吞吐量低的指令转化成延迟低、吞吐量大的指令;
分支优化,其是通过将分支置于循环外、拆分循环、合并多个条件、优化分支顺序四种方式以实现。
2.如权利要求1所述的气体动理论统一算法中的CPU+GPU异构并行优化方法,其特征在于,在S1中,通过对三维程序计算流程和需求分析进行梳理,得到三维CUDA程序总体设计思路与子程序之间的调用关系,进而通过子程序的运行流程和热点代码,得出软件内部各子程序的CPU消耗时间。
3.如权利要求1所述的气体动理论统一算法中的CPU+GPU异构并行优化方法,其特征在于,在S2中,存储器的使用进行配置方法被配置为包括:
S21、将统一算法中子程序用于数据传输的全局变量按照功能进行分组;
S22、对热点代码中的每组变量被各子程序调用的次数进行统计。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国空气动力研究与发展中心超高速空气动力研究所,未经中国空气动力研究与发展中心超高速空气动力研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010751046.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种塑料原料备用的加工工艺
- 下一篇:一种塑料制品原料拌制和输送一体化设备