[发明专利]基于分组多流的GPU上多区结构网格CFD加速方法有效

专利信息
申请号: 201310189688.8 申请日: 2013-05-21
公开(公告)号: CN103226540A 公开(公告)日: 2013-07-31
发明(设计)人: 邓小刚;徐传福;张理论;车永刚;王勇献;姜屹;刘化勇;刘巍 申请(专利权)人: 中国人民解放军国防科学技术大学
主分类号: G06F15/173 分类号: G06F15/173
代理公司: 国防科技大学专利服务中心 43202 代理人: 郭敏
地址: 410073 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 分组 gpu 上多区 结构 网格 cfd 加速 方法
【说明书】:

技术领域

发明涉及GPU上多区结构网格CFD的加速方法,特别是利用多区结构网格CFD分区计算特点和GPU流处理机制,根据CFD应用问题的存储需求和GPU全局显存大小,对多个网格分区进行分组并在组内实现不同网格分区利用GPU多流加速的方法。

背景技术

计算流体动力学(Computational Fluid Dynamics,CFD)以理论流体力学与计算技术为基础,是流体力学当代新兴的一个分支学科。CFD通过数值方法求解流体力学控制方程,得到流场离散的定量描述,即所谓的流场在时间、空间点上的数值解,并以此预测流体运动规律。近三、四十年以来,随着计算技术与计算机技术的迅猛发展,CFD已发展成为一门独立学科,在航空、航天、气象、船舶、水利等方面应用十分广泛。CFD在确定计算区域的几何描述后需要采用网格划分技术将计算域表示成离散形式,网格按网格点之间的邻接关系可分为结构网格、非结构网格和混合网格三类。目前,结构网格仍是CFD应用中的首选,具有拓扑结构简单、数据存储开销小、索引方便、流场计算精度高、边界处理能力强等优点,通过引入分区、重叠网格等技术,结构网格在一定程度上能适应复杂外形的模拟。

随着数值模拟的几何外形日益复杂,流动机理研究越来越精细,CFD计算的网格规模和复杂度也空前增长,采用并行计算技术实现CFD并行计算已成为提高CFD应用效率的关键技术途径之一。传统CPU上并行计算主要采用分区并行方法[向大平等,低马赫数流动分区并行计算研究,空气动力学报,2002],利用消息传递通信实现任务并行或共享存储实现线程并行[莫则尧等,消息传递并行编程环境MPI,科学出版社,2001]。近年来,在高性能计算机系统的设计和实现中纷纷采用图形处理单元(Graphics Processing Unit,GPU)等作为加速处理部件,取得了惊人的性能提升。例如,我国的“天河一号”凭借CPU和GPU混合异构架构获得2010年TOP500[www.top500.org,2010]的第一。2007年NVIDIA公司[www.nvidia.com,2012]推出了统一计算架构(Compute Unified Device Architecture,CUDA),CUDA通过对C、Fortran等数值计算高级语言进行简单的扩展,大大提高了GPU开发的效率和灵活性。近年来国外以欧美发达国家为主的大量学者结合GPU体系结构特点,逐步将一些CFD应用移植到GPU平台上,取得了很好的加速效果。例如,2008年,T.Brandvik等[T.Brandvik等,Acceleration of a 3D Euler solver using commodity graphics hardware,AIAA-2008-607 2008;T.Brandvik等,采用商业图形硬件加速3D欧拉求解器,AIAA-2008-607,2008]首次采用GPU进行了三维Euler方程的显式格式求解。同年,E.Elsen等[E.Elsen等,Large calculation of the flow over a hypersonic vehicle using a GPU,J.Comp.Phys.2008;E.Elsen等,基于GPU的超声速飞行器流动复杂计算,J.Comp.Phys.2008]开展了更具实际工程意义的工作,实现了多区结构网格可压缩欧拉求解器的GPU并行。2009年,A.Corrigan等[A.Corrigan等,Running unstructured grid based CFD solvers on modern graphics hardware,the 19th AIAA CFD Conference,2009;A.Corrigan等,在图形硬件上实现的非结构网格CFD求解器,19届AIAA CFD会议,2009]在Tesla C1060GPU上实现了一个非结构可压缩欧拉求解器的GPU并行。2009年,D.C.Jesperson等[D.C.Jesperson等,Acceleration of a CFD Code with a GPU,NAS Technical Report NAS-09-003,2009;D.C.Jesperson等,在GPU上加速CFD代码,NAS技术报告NAS-09-003,2009]对一个利用隐式SSOR方法求解结构网格RANS方程的CFD程序进行了GPU并行。为了进一步提高GPU计算的规模和加速比,近年来有学者实现了GPU集群上的CFD代码加速。2009年,E.H.Phillips等[E.H.Phillips等,Rapid aerodynamic performance prediction on a cluster of graphics processing units,the47th AIAA Aerospace Sciences Meeting,2009;E.H.Phillips等,在图形处理单元集群上进行快速空气动力学性能预测,47届AIAA航空宇航科学会议]实现了一个支持GPU集群的可压缩多区结构网格求解器,能够利用包括16块GPU卡的GPU集群进行加速。2010年,D.Jacobsen等[D.Jacobsen等,An MPI-CUDA implementation for massively parallel incompressible flow computations on multi-GPU clusters,the48th AIAA Aerospace Sciences Meeting;D.Jacobsen等,多GPU集群上大规模不可压流计算的MPI-CUDA实现,48届AIAA航空宇航科学会议]实现了一个支持包括128块GPU的集群的不可压Jacobi迭代CFD求解器。国内在基于GPU加速CFD并行计算方面开展的工作仍然较少。南京航空航天大学的张兵等[张兵等,基于GPU和隐式格式的CFD并行计算方法,航空学报,2010]探索了在个人计算机上如何采用GPU进行一般规模CFD问题的加速并行计算,实现了三维Euler方程的GPU并行。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310189688.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top