[发明专利]一种基于申威26010处理器的矩阵转置方法及系统在审
申请号: | 201811094916.2 | 申请日: | 2018-09-19 |
公开(公告)号: | CN109445850A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 胡波;李一明;秦旭;彭星洪;李晋 | 申请(专利权)人: | 成都申威科技有限责任公司 |
主分类号: | G06F9/345 | 分类号: | G06F9/345;G06F17/16 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立;董德 |
地址: | 610200 四川省成都市双*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于申威26010处理器的矩阵转置方法,包括如下步骤:S1,将主核中存储的矩阵A划分为64个子矩阵,并对64个子矩阵进行编号;S2,对64个从核进行与64个子矩阵的编号对应的编号,并分别将64个子矩阵读取到与子矩阵对应编号的从核中;S3,分别对每个从核中的子矩阵进行转置,得到64个转置后的从核;S4,将64个转置后的从核按照从核的编号顺序排列成8×8形式的矩阵B,并对矩阵B通过核间寄存器通信方式进行转置,得到矩阵C;S5,将矩阵C存储到主核,完成转置。通过将较大的矩阵分解为规模较小的多个分块,再通过分块矩阵转置和矩阵传输并行,使转置效率得到提升。 | ||
搜索关键词: | 矩阵 转置 从核 矩阵转置 子矩阵 处理器 主核 存储 分块矩阵 间寄存器 矩阵传输 矩阵读取 矩阵分解 通信方式 分块 并行 | ||
【主权项】:
1.一种基于申威26010处理器的矩阵转置方法,所述申威26010处理器的1个核组包括1个主核和64个从核,其特征在于,包括如下步骤:S1,将所述主核中存储的矩阵A划分为64个子矩阵,并对64个所述子矩阵进行编号;S2,对64个所述从核进行与64个所述子矩阵的编号对应的编号,并分别将64个所述子矩阵读取到与所述子矩阵对应编号的所述从核中;S3,分别对每个所述从核中的所述子矩阵进行转置,得到64个转置后的从核;S4,将64个所述转置后的从核按照所述从核的编号顺序排列成8×8形式的矩阵B,并对所述矩阵B通过核间寄存器通信方式进行转置,得到矩阵C;S5,将所述矩阵C存储到所述主核中,完成转置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都申威科技有限责任公司,未经成都申威科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811094916.2/,转载请声明来源钻瓜专利网。
- 上一篇:主要由预设高斯整数组成的完美高斯整数序列的产生方法
- 下一篇:多线程处理器