[发明专利]基于GPU的异构大型矩阵求解方法在审
申请号: | 202110428174.8 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113076520A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 万波;刘民庆 | 申请(专利权)人: | 湖北九同方微电子有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F9/54;G06F9/50 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430000 湖北省武汉市湖北省武汉东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gpu 大型 矩阵 求解 方法 | ||
1.基于GPU的异构大型矩阵求解方法,包括,其特征在于,所述;
(1)将矩阵进行简单的分块,每个线程块负责计算乘积矩阵的一个子方阵(块内的每个线程负责计算子方矩阵的一个元素);
(2)首先使用每个线程加载分块方阵对应元素,然后计算乘积方阵的一个元素;
(3)每一线程将乘积的结果,累计到寄存器中,执行完毕后,将结构写入GPU内存中。
2.根据权利要求1所述的基于GPU的异构大型矩阵求解方法,其特征在于,所述矩阵分解为多个16×16的方阵。
3.根据权利要求1所述的基于GPU的异构大型矩阵求解方法,其特征在于,所述每个线程块使用256个线程并行计算。
4.根据权利要求1所述的基于GPU的异构大型矩阵求解方法,其特征在于,所述每个线程块分配16×16个线程,建立(m/16)×(n/16)个线程块。
5.根据权利要求1所述的基于GPU的异构大型矩阵求解方法,其特征在于,所述将GPU内存大小配置呈16的倍数,并在复制矩阵到显卡内存之前,将其清零;
(1)根据n阶方阵,进行算法流程,并分配共享内存空间;
(2)将该线程需要计算的分块矩阵的对应行列载入共享内存对应的位置;
(3)线程同步,确保各个线程册要数据都已经完全装在共享内存中,并用Kahan求和公式计算结果;
(4)线程同步,确保以上各个线程计算均完成,将结果写入矩阵对应的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北九同方微电子有限公司,未经湖北九同方微电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110428174.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种沉淀法白炭黑制浆装置
- 下一篇:一种可注射左旋聚乳酸微粒的制备方法