[发明专利]一种KNL集群加速求解方法及装置在审
申请号: | 201611208888.3 | 申请日: | 2016-12-23 |
公开(公告)号: | CN106598913A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 王明清;张清 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F17/11 | 分类号: | G06F17/11;G06F17/16 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 knl 集群 加速 求解 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,特别涉及一种KNL集群加速求解方法及装置。
背景技术
数学物理模型的求解是众多工程生产与科研领域必不可少的工作之一。随着计算机的发展,有限差分、有限元、边界元、无网格方法等一系列的数值计算方法相继诞生。这些数值计算方法具有一个相同之处:将实际问题导出的数学物理模型通过特定的方式离散成一个线性代数方程组。运用有限元方法离散得到的线性方程组往往是对称正定的或经过简单的处理可变成对称正定问题。然而,随着问题规模的增大,线性方程组的求解成为工程生产和科研中的一大瓶颈。因此,如何提高缩短了求解大规模对称正定线性方程组的时间,而且降低了能耗,减少了机房管理、运维的成本,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种KNL集群加速求解方法及装置,将共轭梯度算法移植到了KNL集群平台上,提高硬件资源的利用率,从而缩短了求解大规模对称正定线性方程组的时间,降低了能耗,降低开发成本。
为解决上述技术问题,本发明提供一种KNL集群加速求解方法,包括:
读取对称正定线性方程组的系数矩阵及常数项,并设定初始解及求解精度要求;
利用MPI控制各KNL内核进行程序主体计算,构造近似解;其中,程序主体为集成在KNL内核中的大规模稀疏矩阵向量相乘、向量加法、向量内积、标量与向量乘积的运算代码段;
判断所述近似解是否满足所述求解精度要求;
若是,则输出满足所述求解精度要求的近似解。
可选的,利用MPI控制各KNL内核进行程序主体计算,构造近似解,包括:
将所述对称正定线性方程组的求解任务进行划分;
根据求解任务的划分个数启动对应数量的进程,并为每个进程设置私有存储空间;
MPI主进程读取预定数据,并将所述预定数据发送给全部进程;其中,所述预定数据包括所述系数矩阵、所述常数项及所述初始解;
所述MPI主进程接收全部进程根据所述预定数据进行计算后的结果,并对全部结果进行处理,得到近似解。
可选的,将所述对称正定线性方程组的求解任务进行划分,包括:
采用静态划分方式,按行划分将对称正定线性方程组的系数矩阵按行划分成N_p块;其中,N_p=Nnode*Ngrp;其中,Nnode为KNL集群中计算节点个数,Ngrp为每个计算节点内将处理核心划分成Ngrp个组。
可选的,KNL内核进行程序主体计算,包括:
所述KNL内核组开启4*Nknlcore个OpenMP线程进行程序主体计算。
可选的,KNL内核进行程序主体计算,包括:
将程序主体中内存读写受限的数据或数组开辟到MCDRAM高带宽内存。本发明还提供一种KNL集群加速求解装置,包括:
读取模块,用于读取对称正定线性方程组的系数矩阵及常数项,并设定初始解及求解精度要求;
近似解求解模块,用于利用MPI控制各KNL内核进行程序主体计算,构造近似解;其中,程序主体为集成在KNL内核中的大规模稀疏矩阵向量相乘、向量加法、向量内积、标量与向量乘积的运算代码段;
判断求解精度模块,用于判断所述近似解是否满足所述求解精度要求;
结果输出模块,用于输出满足所述求解精度要求的近似解。
可选的,所述近似解求解模块,包括:
任务划分单元,用于将所述对称正定线性方程组的求解任务进行划分;
任务分配单元,用于根据求解任务的划分个数启动对应数量的进程,并为每个进程设置私有存储空间;
数据分配单元,用于MPI主进程读取预定数据,并将所述预定数据发送给全部进程;其中,所述预定数据包括所述系数矩阵、所述常数项及所述初始解;
近似解求解单元,用于所述MPI主进程接收全部进程根据所述预定数据进行计算后的结果,并对全部结果进行处理,得到近似解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611208888.3/2.html,转载请声明来源钻瓜专利网。