[发明专利]带有子矩阵定序的矩阵乘法器在审
申请号: | 201980077886.0 | 申请日: | 2019-06-18 |
公开(公告)号: | CN113168430A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 马克西姆·V·卡扎科夫;毛健 | 申请(专利权)人: | 超威半导体公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 上海胜康律师事务所 31263 | 代理人: | 李献忠;张华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 带有 矩阵 乘法器 | ||
1.一种方法,所述方法包括:
在图形处理单元(GPU)[100]的矩阵乘法器[110]的第一乘法周期[301]内,将第一矩阵[220]和第二矩阵[222]相乘:
将存储在第一输入寄存器[106]处的所述第一矩阵的第一子矩阵与存储在第二输入寄存器[107]处的所述第二矩阵的第一子矩阵相乘;
在所述矩阵乘法器的第二乘法周期[302]内,所述第二乘法周期接在所述第一乘法周期之后:
将存储在所述第一输入寄存器处的所述第一矩阵的所述第一子矩阵与存储在第二输入寄存器处的所述第二矩阵的第二子矩阵相乘;以及
在所述第一乘法周期和所述第二乘法周期内维持在所述第一输入寄存器处的所述第一子矩阵。
2.如权利要求1所述的方法,所述方法还包括:
在所述矩阵乘法器的第三乘法周期[303]内,所述第三乘法周期接在所述第二乘法周期之后:
将存储在所述第一输入寄存器处的所述第一矩阵的所述第一子矩阵与存储在第二输入寄存器处的所述第二矩阵的第二子矩阵相乘;以及
在所述第一乘法周期、所述第二乘法周期和所述第三乘法周期内维持在所述第一输入寄存器处的所述第一子矩阵。
3.如权利要求1所述的方法,其中所述第一子矩阵包括至少一个非零元素。
4.如权利要求1所述的方法,所述方法还包括:
基于所述第一乘法周期和所述第二乘法周期的结果来确定所述第一矩阵和所述第二矩阵的乘积,所述乘积包括结果矩阵[224]。
5.如权利要求4所述的方法,其中确定所述乘积包括:
基于所述第一乘法周期和所述第二乘法周期的结果来确定所述结果矩阵的子矩阵。
6.如权利要求5所述的方法,其中所述结果矩阵的所述子矩阵包括所述结果矩阵的列和行中的一者。
7.如权利要求4所述的方法,其中确定所述乘积包括:
基于所述第一乘法周期和所述第二乘法周期的结果来确定外积。
8.如权利要求1所述的方法,所述方法还包括:
在所述矩阵乘法器的第三乘法周期内,所述第三乘法周期接在所述第一乘法周期之后:
将存储在所述第一输入寄存器处的所述第一矩阵的第二子矩阵与存储在所述第二输入寄存器处的所述第二矩阵的第二子矩阵相乘;以及
在所述第三乘法周期内将所述第一矩阵的所述第一子矩阵改变为所述第一矩阵的所述第二子矩阵。
9.一种方法,所述方法包括:
在图形处理单元(GPU)[100]的矩阵乘法器[110]处将第一矩阵[220]的子矩阵与第二矩阵[222]的子矩阵相乘,其中所述相乘包括:
在第一多个乘法周期内,将第一子矩阵维持在所述矩阵乘法器的第一输入寄存器[107]处。
10.如权利要求9所述的方法,其中所述相乘还包括:
在所述第一多个乘法周期内,改变在所述矩阵乘法器的第二输入寄存器[106]处的子矩阵。
11.如权利要求10所述的方法,进一步其中所述相乘还包括:
在第二多个乘法周期内,将第二子矩阵维持在所述矩阵乘法器的所述第二输入寄存器处。
12.如权利要求9所述的方法,其中所述第一子矩阵的至少一个元素是非零元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超威半导体公司,未经超威半导体公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980077886.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于检测健康状况的系统和方法
- 下一篇:复合电缆