[发明专利]一种应用于三角矩阵与矩阵乘法的加速方法及其加速装置有效
申请号: | 201710046584.X | 申请日: | 2017-01-19 |
公开(公告)号: | CN106919536B | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 薛瑞;谭旭;朱亚涛;叶笑春;王达;张浩;范东睿 | 申请(专利权)人: | 北京中科睿芯科技有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 北京科龙寰宇知识产权代理有限责任公司 11139 | 代理人: | 孙皓晨 |
地址: | 100000 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种应用于三角矩阵与矩阵乘法的加速方法,包括以下步骤:S1:从内存中取出地址连续的三角矩阵,该三角矩阵的边长为n;S2:以边长m对所述三角矩阵进行分块,得到多个小矩形阵和多个小三角阵;S3:对所述小三角阵进行扩展,使其成为边长为m的小矩形阵;S4:对所有的小矩形阵并行进行矩阵乘法计算。本发明还公开一种根据上述方法制成的加速装置。 | ||
搜索关键词: | 一种 应用于 三角 矩阵 乘法 加速 方法 及其 装置 | ||
【主权项】:
1.一种应用于三角矩阵与矩阵乘法的加速方法,其特征在于,包括以下步骤:S1:从内存中取出地址连续的三角矩阵,该三角矩阵的边长为n;S2:以边长m对所述三角矩阵进行分块,得到多个小矩形阵和多个小三角阵;S3:对所述小三角阵进行微量数据的扩展,使其成为边长为m的小矩形阵;S4:对所有的小矩形阵并行进行矩阵乘法计算;所述步骤S3中对所述小三角阵进行扩展,是指对所述小三角阵补零以得到边长为m的小矩形阵;所述步骤S3的具体执行方式为:步骤1:输入k号数据块;所述数据块是步骤S2中以边长m对所述三角矩阵进行分块后得到的数据块;k为大于等于1的整数,且小于等于所述数据块总数;步骤2:判断k号数据块是否是小三角矩阵块;步骤3:对于已经判断出来的k号小三角矩阵块按照连续地址空间进行取数;步骤4:对于已经划分出来的小三角阵,首先按照划分的地址空间连续取一个数据,并在该数据地址下增加m‑1个连续数据空间,所述m‑1个数据空间内补充数据0;接着连续取两个数据,并增加m‑2个连续数据空间,所述m‑2个数据空间内补充数据0;以此类推,直至不需要补充数据0;步骤5:将补充后的小矩阵块传到下一个矩阵与矩阵相乘的计算单元;步骤6:返回步骤1,输入下一个号的数据块。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科睿芯科技有限公司,未经北京中科睿芯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710046584.X/,转载请声明来源钻瓜专利网。