[发明专利]一种稀疏结构化三角方程组求解的高性能实现方法和装置有效
申请号: | 202110623380.4 | 申请日: | 2021-06-04 |
公开(公告)号: | CN113297537B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 陈道琨;杨超;刘芳芳 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F17/12 | 分类号: | G06F17/12;G06F17/13;G06F17/16;G06T1/20;G06F9/50 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 稀疏 结构 三角 方程组 求解 性能 实现 方法 装置 | ||
本发明公开一种面向GPU平台的稀疏结构化三角方程组求解的高性能实现方法和装置。本发明针对结构化问题的特点提出了一种改进的线程资源分配策略,有效改善了现有方法资源分配不均衡的问题。本发明还结合当今主流商用GPU的架构特点,利用硬件谓词执行等一系列手段,提供一套该算法的高效实现方法。本发明提供的算法框架处理规则结构化问题的性能大幅优于目前商用以及尚处研究阶段的框架。
技术领域
本申请涉及GPU平台上的高性能并行算法框架及实现方式,具体涉及一种面向GPU平台的稀疏结构化三角方程组求解的高性能实现方法和装置。
背景技术
稀疏三角方程组求解(Sparse Triangular Solver,SpTRSV)代指一类以一个行压缩(Compressed Row,CSR)格式存储的稀疏三角矩阵(L)以及一个右端项(Right-handSide,RHS)向量(b)作为输入,输出满足等式Lx=b的未知量向量(x)的计算过程。当多数矩阵元素为零的情况下,为节省存储空间,CSR格式是以三个数组Ai[·],Aj[·],Aa[·]记录矩阵非零元素(Nonzero,NNZ)位置以及其数值的数据结构。矩阵第r行的第k个非零元素的列下标及数值分别为Aj[Ai[r]+k]以及Aa[Ai[r]+k]。结构化稀疏三角方程组问题指一类在数值计算领域经常出现的,由规模为X×Y×Z的网格产生的,具有固定非零元分布(Ai[·],Aj[·])的SpTRSV问题。
稀疏三角方程组求解在数值计算领域是一类非常重要的计算函数。此类应用对硬件的计算和访存性能要求较高,随着硬件平台的发展,像SpTRSV这类的计算操作大多已经被迁移到了GPU上进行。在当前的硬件构造体系下,SpTRSV的耗时主要受限于硬件访存带宽。为在反映SpTRSV效率的同时体现其硬件访存资源的利用情况,目前主要以有效访存带宽(Effective Bandwidth)作为SpTRSV的性能评价指标,其计算方式如下:
SpTRSV的有效访存带宽越高,说明其计算效率越高,相应地对硬件访存资源的利用效果越好。
针对GPU平台,已处于商用阶段的SpTRSV求解器有NVIDIA公司CUSPASER数学库中包含的csrsv2。Csrsv2采用Level Scheduling方法,通过对三角方程组内各方程按求解的优先次序进行排列,再调动GPU资源并发计算各方程未知量的形式解决SpTRSV问题。该方法可以较为充分地利用GPU硬件资源,但对方程组的排序流程大幅增加了SpTRSV的执行时间,导致其有效访存带宽急剧下降。
当前尚处研究阶段的SpTRSV以Liu等人提出的无同步(Synchronization Free)方法为主。此类SpTRSV方法在对GPU硬件资源的利用上有所让步,但能够省去方程组的排序流程,实际有效访存带宽相比Level Scheduling方法反而有所提升。
尽管目前有众多针对GPU平台的SpTRSV的计算方法,但它们在处理结构化SpTRSV问题时的有效访存带宽也仅仅只占GPU硬件访存带宽上限的极小部分,难以满足多数应用对SpTRSV计算模块的性能要求,因此有必要针对GPU平台提出更为有效的SpTRSV算法。
发明内容
本发明提供一种面向GPU平台的稀疏结构化三角方程组求解的高性能实现方法和装置,以满足对SpTRSV计算模块的性能要求,解决现有方法中GPU资源闲置的问题。
本发明的一种面向GPU平台的稀疏结构化三角方程组求解的高性能实现方法,其步骤包括:
步骤一、根据输入结构化问题的网格维度对三角方程组进行任务划分。划分过程将产生Y×Z个子问题,归为Z个任务组。
步骤二、根据任务划分结果,依序向任务组分配GPU资源。若分配过程中可用GPU资源不足,则等待先前任务的GPU资源释放后再继续分配GPU资源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110623380.4/2.html,转载请声明来源钻瓜专利网。