[发明专利]面向向量处理器的大矩阵相乘的向量化实现方法有效
申请号: | 201110338108.8 | 申请日: | 2011-10-31 |
公开(公告)号: | CN102411558A | 公开(公告)日: | 2012-04-11 |
发明(设计)人: | 刘仲;陈书明;陈跃跃;曾咏涛;刘衡竹;陈海燕;龚国辉;彭元喜;陈胜刚 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 湖南兆弘专利事务所 43008 | 代理人: | 周长清 |
地址: | 410073 湖南省长沙市开福区砚瓦池正街47号*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向向量处理器的大矩阵相乘的向量化实现方法,包括以下步骤:(1)输入被乘数矩阵A和乘数矩阵B;通过DMA控制器将被乘数矩阵A和乘数矩阵B分别搬运到向量存储单元中;搬运时,将乘数矩阵B中的第1~n行依次排序为第1~n列;(2)将被乘数矩阵A的一行和乘数矩阵B的一列中的元素分别加载到K个并行处理单元中,并一一对应相乘;相乘的结果在一指定的并行处理单元中归约求和;求和结果作为一个结果矩阵元素存储到向量存储单元中;(3)顺移到被乘数矩阵A的下一行和乘数矩阵B的下一列,重复步骤(2)直至完成所有数据帧的计算,得到由结果矩阵元素组成的结果矩阵C。本发明原理简单且操作方便,能提高计算效率。 | ||
搜索关键词: | 面向 向量 处理器 矩阵 相乘 量化 实现 方法 | ||
【主权项】:
一种面向向量处理器的大矩阵相乘的向量化实现方法,具特征在于包括以下步骤:(1)输入被乘数矩阵A和乘数矩阵B;通过DMA控制器将被乘数矩阵A和乘数矩阵B分别搬运到向量存储单元中;在搬运过程中,将乘数矩阵B进行重排序,即将乘数矩阵B中的第1~n行依次排序为第1~n列;(2)将被乘数矩阵A一行中的元素和乘数矩阵B中一列中的元素分别加载到K个并行处理单元中,并一一对应相乘;将相乘的结果在一指定的并行处理单元中归约求和;将求和结果作为一个结果矩阵元素存储到向量存储单元中;(3)顺移到被乘数矩阵A的下一行和乘数矩阵B的下一列,重复步骤(2)直至完成所有数据帧的计算,得到由结果矩阵元素组成的结果矩阵C。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110338108.8/,转载请声明来源钻瓜专利网。
- 上一篇:利用入湖河水漂浮栽培薄荷的方法
- 下一篇:一种北方日光节能温室