[发明专利]一种应用于三角矩阵与矩阵乘法的加速方法及其加速装置有效
申请号: | 201710046584.X | 申请日: | 2017-01-19 |
公开(公告)号: | CN106919536B | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 薛瑞;谭旭;朱亚涛;叶笑春;王达;张浩;范东睿 | 申请(专利权)人: | 北京中科睿芯科技有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 北京科龙寰宇知识产权代理有限责任公司 11139 | 代理人: | 孙皓晨 |
地址: | 100000 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 三角 矩阵 乘法 加速 方法 及其 装置 | ||
1.一种应用于三角矩阵与矩阵乘法的加速方法,其特征在于,包括以下步骤:
S1:从内存中取出地址连续的三角矩阵,该三角矩阵的边长为n;
S2:以边长m对所述三角矩阵进行分块,得到多个小矩形阵和多个小三角阵;
S3:对所述小三角阵进行微量数据的扩展,使其成为边长为m的小矩形阵;
S4:对所有的小矩形阵并行进行矩阵乘法计算;
所述步骤S3中对所述小三角阵进行扩展,是指对所述小三角阵补零以得到边长为m的小矩形阵;所述步骤S3的具体执行方式为:
步骤1:输入k号数据块;所述数据块是步骤S2中以边长m对所述三角矩阵进行分块后得到的数据块;k为大于等于1的整数,且小于等于所述数据块总数;
步骤2:判断k号数据块是否是小三角矩阵块;
步骤3:对于已经判断出来的k号小三角矩阵块按照连续地址空间进行取数;
步骤4:对于已经划分出来的小三角阵,首先按照划分的地址空间连续取一个数据,并在该数据地址下增加m-1个连续数据空间,所述m-1个数据空间内补充数据0;接着连续取两个数据,并增加m-2个连续数据空间,所述m-2个数据空间内补充数据0;以此类推,直至不需要补充数据0;
步骤5:将补充后的小矩阵块传到下一个矩阵与矩阵相乘的计算单元;
步骤6:返回步骤1,输入下一个号的数据块。
2.根据权利要求1所述的一种应用于三角矩阵与矩阵乘法的加速方法,其特征在于,若三角矩阵的边长n能被小矩形阵的边长m整除,则所述三角矩阵直接划分为(n2-nm)/2m2个小矩形阵和n/m个小三角阵;若n不能被m整除,则对n/m取整,并将余下行的数据与n/m取整的行整合到一起,再统一进行补零和计算。
3.一 种根据权利要求1-2中任一项的方法制成的加速装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科睿芯科技有限公司,未经北京中科睿芯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710046584.X/1.html,转载请声明来源钻瓜专利网。