[发明专利]一种大型稀疏矩阵乘以其转置矩阵的GPU加速方法在审
申请号: | 201811464467.6 | 申请日: | 2018-12-03 |
公开(公告)号: | CN109597691A | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 周赣;姚瑶;冯燕钧;傅萌;张涛;鹿军;贺欢;李强;李静 | 申请(专利权)人: | 东南大学;国网辽宁省电力有限公司鞍山供电公司;中国电力科学研究院有限公司;国家电网有限公司 |
主分类号: | G06F9/52 | 分类号: | G06F9/52;G06F7/78 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 张婧 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种大型稀疏矩阵乘以其转置矩阵的GPU加速方法,包括如下步骤:CPU中将大型稀疏矩阵A以CSR稀疏存储格式存储;CPU中调用cuSPARSE函数cusparseDcsrgemm2执行A×AT,得到稀疏矩阵C的CSR稀疏存储格式,并生成COO稀疏存储格式;CPU将GPU内核函数计算所需数据传输给GPU;GPU中执行稀疏矩阵乘以其转置矩阵的内核函数SparseMM:C=A×AT。本发明利用CPU控制程序的流程并处理基础数据和GPU处理密集的浮点运算相结合的模式提高了大型稀疏矩阵乘以其转置的效率,解决了电力系统状态估计中信息矩阵计算耗时大的问题。 | ||
搜索关键词: | 稀疏矩阵 存储格式 转置矩阵 稀疏 内核函数 电力系统状态估计 浮点运算 基础数据 数据传输 信息矩阵 转置 调用 耗时 存储 | ||
【主权项】:
1.一种大型稀疏矩阵乘以其转置矩阵的GPU加速方法,其特征在于,所述方法包括如下步骤:(1)、CPU中将大型稀疏矩阵A以CSR稀疏存储格式存储,稀疏矩阵A的CSR稀疏存储格式存储到三个向量中,分别是行偏移A_RowPtr,列号A_ColInd以及数值A_Val;(2)、CPU中调用cuSPARSE函数cusparseDcsrgemm2执行A×AT,得到稀疏矩阵C的CSR稀疏存储格式,并生成COO稀疏存储格式;所述稀疏矩阵C的CSR稀疏存储格式:行偏移C_RowPtr、列号C_ColInd和数值C_Val,所述稀疏矩阵C的COO稀疏存储格式中的行号C_RowInd;(3)、CPU将GPU内核函数计算所需数据传输给GPU;(4)、GPU中执行稀疏矩阵乘以其转置矩阵的内核函数SparseMM:C=A×AT,该稀疏矩阵乘以其转置矩阵内核函数定义为SparseMM,其线程块数量Nblocks取值为稀疏矩阵C的非零元个数nnzC和65535中较小者,线程块大小Nthreads固定为32。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学;国网辽宁省电力有限公司鞍山供电公司;中国电力科学研究院有限公司;国家电网有限公司,未经东南大学;国网辽宁省电力有限公司鞍山供电公司;中国电力科学研究院有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811464467.6/,转载请声明来源钻瓜专利网。