[发明专利]一种面向可编程代数处理器的矩阵乘法计算装置及方法有效
申请号: | 201410123578.6 | 申请日: | 2014-03-28 |
公开(公告)号: | CN103902507B | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 郭晓龙;王晓琴;王伟康;吴军宁;林啸;郭璟;张森;赵旭莹 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 可编程 代数 处理器 矩阵 乘法 计算 装置 方法 | ||
1.一种矩阵乘法计算装置,其特征在于,该装置包括多粒度并行存储器(10)、数据缓存装置(20)、数据广播缓存装置(30)和向量运算装置(40);
所述的多粒度并行存储器(10)用于存储要进行乘法运算的矩阵、广播索引以及矩阵乘法之后的结果;
所述数据缓存装置(20)用于暂存从多粒度并行存储器(10)中取出的要进行乘法运算的矩阵;
所述数据广播缓存装置(30)用于将要进行数据广播操作的矩阵从多粒度并行存储器(10)中取出,并对所述矩阵的数据进行广播操作;所述数据广播缓存装置(30)包括数据广播控制单元(301)、数据缓存实体(302)和广播索引寄存器(303),其中数据广播控制单元(301)用于控制数据广播操作;
所述向量运算装置(40)用于将从所述数据缓存装置(20)中读取得到的矩阵进行向量运算,或将从所述数据缓存装置(20)中读取得到的矩阵和从所述数据广播缓存装置(30)中读取的矩阵进行向量运算,并将结果写入所述多粒度存储器(10)中。
2.如权利要求1所述的矩阵乘法计算装置,其特征在于,所述多粒度并行存储器的读写位宽、数据缓存装置(20)中寄存器堆(201)的位宽、数据广播缓存装置中相关寄存器位宽以及所述向量运算装置(40)的运算尺寸相等。
3.如权利要求1所述的矩阵乘法计算装置,其特征在于,所述数据广播缓存装置对所述矩阵的数据依据广播索引寄存器(303)中的广播索引进行广播操作。
4.如权利要求1所述的矩阵乘法计算装置,其特征在于,所述向量运算单元(40)包括乘法运算单元(401)和累加运算单元(402)。
5.一种矩阵乘法计算方法,其特征在于,包括如下步骤:
步骤S1:分别从多粒度并行存储器10中按行读取L×M行的A系列矩阵以及按行读取M×N行的B系列矩阵到数据缓存装置(20)中,A系列矩阵放置在寄存器堆(201)中的Ck寄存器中,B系列矩阵放置在寄存器堆(201)中的寄存器中Dl,其中k∈[1,L*M],l∈[1,M*N];
步骤S2:令k1=0,k2=0;
步骤S3:取Ck中第k1×M+1到(k1+1)×M行数据和Dl中第k2×M+1到(k2+1)×M行数据,其相应行分别进行点乘操作,然后将结果进行累加操作,得到结果E,最后将E写回到多粒度并行存储器(10)中;
步骤S4:k2加1,重复步骤S3,直到k2等于N为止;
步骤S5:k1加1,重复步骤S3~S4,直到k1等于L为止;
步骤S6:读取下一个L×M行的A系列矩阵和M×N行的B系列矩阵到数据缓存装置(20)中,重复步骤S2~S5,直到所有矩阵计算完毕。
6.一种矩阵乘法计算方法,其特征在于,包括如下步骤:
步骤P1:从多粒度并行存储器(10)中按列读取L×M行1列A矩阵数据到数据广播缓存装置(30)中,并且按行读取M×N行B系列矩阵数据到数据缓存装置(20)中,表示为Dl,其中l∈[1,M*N];
步骤P2:对数据广播缓存装置(30)中的每一个数据进行广播操作,即每一个数据都复制BS份存储在寄存器Ck中,其中k∈[1,L*M],BS为存储器端口位宽所能容纳的最大数据个数;
步骤P3:令k1=0,k2=0;
步骤P4:取Ck中第k1×M+1到(k1+1)×M行数据和Dl中第k2×M+1到(k2+1)×M行数据,其相应行分别进行点乘操作,然后将结果进行累加操作,得到结果E,最后将E写回到多粒度并行存储器(10)中;
步骤P5:k2加1,重复步骤P4,直到k2等于N为止;
步骤P6:k1加1,重复步骤P4~P5,直到k1等于L为止;
步骤P7:读取下一个M×N行的B系列矩阵到数据缓存装置(20)中,重复步骤P3~P6,直到所有矩阵计算完毕。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410123578.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于绑扎机的夹具
- 下一篇:双回路中频感应加热炉