[发明专利]基于多文件流的任意对角线性方程组并行求解方法和系统在审
申请号: | 201910511081.4 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110362785A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 喻高远;金先龙;楼云锋;马志强;李俊杰 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F17/12 | 分类号: | G06F17/12;G06F17/16 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 庄文莉 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子区域 求解 线性方程组 对角 主核 并行 系统方程 多文件 分布式数据存储 读取 高性能计算 并行计算 迭代结束 方程求解 分层通信 数据信息 局部化 从核 缩聚 消去 组装 保存 通信 | ||
本发明提供一种基于多文件流的任意对角线性方程组并行求解方法和系统,包括四个步骤:(1)将带状方程分为若干个初始子区域,并将每个初始子区域数据信息单独保存在对应的文件中;(2)各主核同时单独读取各初始子区域系统方程数据,各从核形成各组装子区域系统方程,并缩聚消去其内部变量;(3)各主核并行求解界面方程;(4)各初始子区域根据各主核界面方程求解结果回代求解内部变量。若迭代结束则终止,否则重新从第二步开始。本发明在实现分布式数据存储的基础上,通过分层通信最大限度实现通信局部化,能够充分利用高性能计算体系的结构特点提升大规模任意对角线性方程组的并行计算效率。
技术领域
本发明涉及一种并行对角方程组求解方法,具体是基于多文件流的任意对角线性方程组并行求解方法和系统。
背景技术
有限元方法作为工程数值分析的一种有力工具,广泛应用于航空航天、能源勘探与开发、交通运输等领域,在工程设计和分析中得到了越来越广泛的重视,已经成为解决复杂工程计算问题的有效途径。然而对于大型复杂系统,由于计算规模巨大,求解复杂,采用传统串行有限元分析方法难以克服所需内存空间大,求解时间长的问题。利用并行计算机研究和开发相应的并行算法则为这类问题的解决提供了切实可行的方法。
在并行算法方面,主要分为两类:一类是从有限元问题自身的并行性出发,形成了区域分解并行计算方法;另一类是从有限元问题中耗时最多的线性方程组的求解出发,寻求高效求解线性方程组的并行计算方法。区域分解方法在同时单独完成网格区域分割的基础上形成各子区域的待求解方程,通过静态缩聚消去内部变量以降低界面方程的阶数,求解界面方程后各子区域可同时回代求解内部变量,其界面方程的规模依赖于网格的区域分割。然而对于大规模有限元数值分析,随着边界节点数目的增加,界面方程的规模随之急剧增大,从而给求解带来困难。而在线性方程组的并行计算方法中,传统的并行计算方法往往面临全局通信过多的问题,由此各个进程在求解过程中产生的通信开销和同步开销的增加也会极大地降低并行计算效率。且在实际问题的稀疏线性方程组中,对角方程组则是其重要组成部分。
从硬件上来说,目前大规模并行计算机采用异构众核分布式存储体系结构,其典型特征是:位于同一节点内的不同处理器之间通过局部总线相连,通信速率很高;而位于不同节点之间的处理器通过高性能网络相连,通信速率相对较低。故要提高大规模异构众核并行计算机的并行计算效率,就要尽量将通信限制在各节点内部,并尽可能减少不同节点之间的通信。如何构造合适的并行算法使之与目前大规模异构众核并行计算机的体系结构相适应以提高并行计算效率成为迫切需要解决的问题。
经对现有技术文献的检索发现:Luo等在Jourpal of Computer Research&Developmept,2000,37(7):802-807上发表文章“Ap effective parallel algorithm forsolvipg tridiagopal”(“三对角线性方程组的一种有效分布式并行算法”,计算机研究与发展,2000,37(7):802-807),该文通过区域分割同时单独形成各子区域的系统方程,并经过缩聚消去每个初始子区域内部变量,得到仅与边界变量相关的各初始子区域的界面方程来减少全局的通信求解时间,进而提高系统整体的并行计算效率。但该方法在实际应用中收到很大的限制,一方面是由于实际问题的带状方程带宽不固定,该方法无法求解;另一方面,由于该方法未充分考虑目前国产高性能计算机的体系结构特点,造成不同子区域间频繁的通信,最终得到的并行计算效率也不是太理想。
发明内容
本发明针对现有技术的不足,提出一种基于多文件流的任意对角线性方程组并行求解方法和系统。
根据本发明提供的一种基于多文件流的任意对角线性方程组并行求解方法,包括如下步骤:
分区步骤:经过分区软件将带状方程剖分为p个初始子区域,并将每个初始子区域的系数矩阵、方程右端项单独保存在一个文件中,其中p为单个节点机内处理器核数的整数倍;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910511081.4/2.html,转载请声明来源钻瓜专利网。