[发明专利]基于GPU集群的相对论性波尔兹曼方程计算方法、存储介质及设备在审
申请号: | 202111460362.5 | 申请日: | 2021-12-02 |
公开(公告)号: | CN114155135A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 张俊杰;彭国良;任泽平;高银军;杜太焦;谢海燕 | 申请(专利权)人: | 西北核技术研究所 |
主分类号: | G06T1/20 | 分类号: | G06T1/20 |
代理公司: | 西安智邦专利商标代理有限公司 61211 | 代理人: | 赵逸宸 |
地址: | 710024 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gpu 集群 相对论 波尔兹曼 方程 计算方法 存储 介质 设备 | ||
本发明属于相对论性波尔兹曼方程求解处理方法,为解决目前通过PRD‑BE求解波尔兹曼方程,当系统涉及到超大规模GPU显卡集群时,计算效率会有大幅度降低的技术问题,提供一种基于大型GPU集群的相对论性波尔兹曼方程计算方法、计算机可读存储介质及设备,计算方法通过将坐标空间进行分割,能够在多GPU设备上进行玻尔兹曼方程的求解,相较于现有的PRD‑BE,能够更好地适配多GPU集群,具备跨节点的并行能力。
技术领域
本发明属于相对论性波尔兹曼方程求解处理方法,具体涉及一种基于大型GPU集群的相对论性波尔兹曼方程计算方法、计算机可读存储介质及设备。
背景技术
相对论性玻尔兹曼方程作为动理学理论的基本方程,在描述非平衡态输运过程中有着十分广泛的应用,相对论性玻尔兹曼方程的基本表达形式如下:
其中,fa(x,p,t)为a类型粒子的分布函数,p为粒子的动量,E为粒子的能量,Ca为碰撞项,碰撞项的表达式为:
上式中为散射矩阵元,可以由量子理论计算得出。
由于较高的维度和复杂的碰撞项积分,长期以来,完整地求解非相对论性玻尔兹曼方程一直都是极具挑战的工作。即使目前,人们可以利用千兆级的计算集群,非相对论性玻尔兹曼方程的求解依然十分困难。
在非相对论玻尔兹曼方程的实际应用中,通常需要非常密集的时空网格来描述与压力、温度、湍流等相关的复杂效应。相对论和非相对论玻尔兹曼方程之间的主要区别在于碰撞项和耦合方程。在相对论玻尔兹曼方程中,碰撞积分通常比非相对论情况下复杂得多。同时,对于相对论性碰撞方程,散射矩阵也更加复杂,而在非相对论的情况下,通常只涉及一种粒子,例如气体或液体。除了碰撞项带来的困难,相对论玻尔兹曼方程往往包含多个耦合方程,也增加了计算的复杂度。因此,完全求解相对论性玻尔兹曼方程在当前的科学技术水平下依然十分困难。
目前,PRD-BE(PHYSICAL REVIEW D-Boltzmann Equation)是首个运行在GPU上的全碰撞项波尔兹曼方程求解程序,相较于传统的粒子模拟方法,能够利用微观理论计算的相互作用散射矩阵元,而无需借助实验参数。在PRD-BE中,GPU显卡的并行主要通过将碰撞积分的采样点进行分割,并分配至多块GPU显卡上进行积分运算,能够正确并快速求解波尔兹曼方程。但是,当系统涉及到超大规模GPU显卡集群时,上述并行方案在计算效率上会有大幅度的降低。具体而言,假设碰撞积分需要400个采样点,PRD-BE中对碰撞项的400个蒙特卡洛采样点进行分割,交由不同的GPU卡进行计算,计算结束后再收回至主节点,这种方法需要在GPU卡之间进行大量的数据交换,因而制约了其并行效率。
发明内容
本发明为解决目前通过PRD-BE求解波尔兹曼方程,当系统涉及到超大规模GPU显卡集群时,计算效率会有大幅度降低的技术问题,提供一种基于大型GPU集群的相对论性波尔兹曼方程计算方法、计算机可读存储介质及设备。
为达到上述目的,本发明采用以下技术方案予以实现:
一种基于GPU集群的相对论性波尔兹曼方程计算方法,其特殊之处在于,包括以下步骤:
S1,由GPU集群中主节点划定分布函数所在的相空间范围,并将分布函数所在的相空间在直角坐标系中划分为多个网格;
S2,根据GPU集群中分节点的数量,对经步骤S1划分的多个网格拆分为多个坐标空间;其中,多个所述坐标空间之间有交叠部分;
S3,将多个坐标空间分别分配至各分节点,在每个分节点上通过中心差分的形式对相对论性波尔兹曼方程的左侧进行更新,并对碰撞积分采用蒙卡方式进行计算;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北核技术研究所,未经西北核技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111460362.5/2.html,转载请声明来源钻瓜专利网。