[发明专利]用于CFD的并行计算方法及系统在审

申请号：	201410658521.6	申请日：	2014-11-18
公开（公告）号：	CN104331271A	公开（公告）日：	2015-02-04
发明（设计）人：	李桦;刘枫;田正雨;潘沙	申请（专利权）人：	李桦;刘枫
主分类号：	G06F9/38	分类号：	G06F9/38;G06F9/50;G06F15/163
代理公司：	北京超凡志成知识产权代理事务所(普通合伙) 11371	代理人：	栾波
地址：	410000 ***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于 cfd 并行计算方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及计算机并行技术，尤其涉及一种用于CFD(Computational Fluid Dynamics，计算流体力学)的大规模并行计算方法及系统。

背景技术

目前，CFD大规模并行技术主要是基于CPU(Central Processing Unit，中央处理器)众核的粗粒度并行。

CPU功能强大，可以完成几乎所有的计算任务。然而，其浮点计算能力受到摩尔定律的限制，随着部件尺度的越来越小，量子效应(霍尔效应)对计算能力的继续提高形成了瓶颈。

CFD计算包括很多种类型，例如，CFD涉及边界面通量计算、网格节点间数据交换、交换面通量计算、内部面通量计算等等。这些不同类型的计算，有些所需浮点计算量大、有些所需的逻辑计算量大，因此，若全部采用CPU或CPU的组合作为网格节点进行计算，由于量子效应造成的计算能力的瓶颈，将严重影响并行计算的效率。

发明内容

有鉴于此，本发明提出一种用于CFD的并行计算方法及系统，旨在突破摩尔效应的限制，提高并行计算的效率。

第一方面，本发明提供了一种用于CFD的并行计算方法，所述方法基于多个计算节点形成的异构体系结构，每一所述计算节点包括至少一个CPU和至少一个GPU(Graphic Processing Unit，中文翻译为“图形处理单元”)，并且，两个计算节点间通过CPU互联；所述用于CFD的并行计算方法包括如下步骤：分解步骤，将CFD的计算任务分解为多个不同类型的任务流；第一分配步骤，将分解获取的任务流分配给所述异构体系结构中的各个计算节点；第二分配步骤，对于所述每一计算节点，在接收到不同种类的多个任务流后，根据各个任务流所需浮点计算量的大小，确定由CPU处理或是由GPU处理；计算及同步步骤，在每一计算节点的所有CPU和所有GPU完成接收的所有任务流后，完成CPU和GPU的同步；并且，不同计算节点的并行通过MPI实现。

进一步地，上述用于CFD的并行计算方法的所述分解步骤中，所述不同类型的任务流包括：内部面通量任务流、边界面通量任务流、交换面通量任务流、节点间数据交换任务流和CPU/GPU数据映射任务流。

进一步地，上述用于CFD的并行计算方法的所述第一分配步骤中，将所述分解获取的任务流重新进行组合，确定组合后所需的计算量，并将组合的任务流分配给与计算能力相匹配的计算节点。

进一步地，上述用于CFD的并行计算方法所述第二分配步骤中：由所述计算节点中的所述CPU进行所述边界面通量任务流和所述交换面通量任务流的计算。

进一步地，上述用于CFD的并行计算方法所述第二分配步骤中：由所述计算节点中的所述GPU进行所述内部面通量任务流的计算。

进一步地，上述用于CFD的并行计算方法所述第二分配步骤中：由所述计算节点间的CPU进行节点间数据交换的计算。

进一步地，上述用于CFD的并行计算方法所述第二分配步骤中：所述CPU/GPU数据映射任务流是由CPU和GPU共同完成，包括数据互相拷贝、数据发送和数据接收。

进一步地，上述用于CFD的并行计算方法还包括：在所述分解步骤前，还包括：网格读入及映射步骤，将网格读入内存中，通过显存映射模型，将网格映射到显存。

与现有技术相比，本发明用于CFD的并行计算方法具有如下优势：

第一、本发明将CFD的计算任务分解为多个不同类型的细粒度任务流细粒度，并行效率高；

第二、本发明一方面发挥CPU的逻辑分支计算能力，采用CPU处理浮点计算量小的任务流，另一方面可以发挥GPU的浮点计算能力，采用GPU处理浮点计算量大的任务流；因此，突破了摩尔效应的限制，解决了量子效应造成的计算能力的瓶颈问题，提高了并行计算的效率。

第二方面，本发明还提供了一种用于CFD的并行计算系统，包括基于多个计算节点形成的异构体系结构，每一所述计算节点包括至少一个CPU和至少一个GPU，并且，两个计算节点间通过CPU互联；

其中，所述计算节点中的CPU用于执行边界面通量任务流和交换面通量任务流的计算；所述计算节点中的GPU进行内部面通量任务流的计算；所述计算节点间的CPU进行节点间数据交换的计算；以及，由CPU和GPU共同完成数据映射任务流的计算，包括数据互相拷贝、数据发送和数据接收；并且，不同计算节点的并行通过MPI实现。

与现有技术相比，本发明用于CFD的并行计算系统具有如下优势：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于李桦;刘枫，未经李桦;刘枫许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410658521.6/2.html，转载请声明来源钻瓜专利网。

上一篇：交易信息处理方法、装置和系统
下一篇：一种用于低功耗处理器的加快条件跳转执行的装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于CFD的并行计算方法及系统在审

专利文献下载