[发明专利]使用处理器指令的硬件加速矩阵操纵运算在审
申请号: | 202011449371.X | 申请日: | 2020-12-09 |
公开(公告)号: | CN113032009A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 托马斯·马克·乌尔里希;克里希纳库马尔·纳拉亚南·奈尔;郝宇辰 | 申请(专利权)人: | 脸谱公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06N3/063;G06N3/08 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 李琰;杨明钊 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 处理器 指令 硬件加速 矩阵 操纵 运算 | ||
1.一种处理器系统,包括:
共享存储器;和
与所述共享存储器通信的处理元件,其中所述处理元件包括矩阵处理器单元,并且所述处理元件被配置为:
接收指定数据矩阵和矩阵操纵运算的处理器指令;
基于所述处理器指令识别操纵矩阵;
将所述数据矩阵和所述操纵矩阵加载到所述矩阵处理器单元中;
执行矩阵运算以确定结果矩阵;和
将所述结果矩阵输出到目的地位置。
2.根据权利要求1所述的系统,其中所述数据矩阵是从所述共享存储器中检索的。
3.根据权利要求1所述的系统,其中所述操纵矩阵是从所述共享存储器中检索的。
4.根据权利要求1所述的系统,其中所述操纵矩阵是从所述处理元件的本地存储器中检索的。
5.根据权利要求1所述的系统,其中所执行的矩阵运算是矩阵乘法运算。
6.根据权利要求1所述的系统,其中所述目的地位置是所述共享存储器。
7.根据权利要求1所述的系统,其中所述目的地位置是矩阵寄存器。
8.根据权利要求1所述的系统,其中所述处理元件是被配置为并行操作的多个处理元件之一。
9.根据权利要求1所述的系统,其中使用输出单元将所述结果矩阵输出到所述目的地位置。
10.根据权利要求9所述的系统,其中所述输出单元被配置为执行多次重复写入,以输出上采样结果矩阵。
11.根据权利要求1所述的系统,其中所述操纵矩阵是上采样矩阵。
12.根据权利要求11所述的系统,其中所述上采样矩阵被配置为在行元素之间执行线性插值。
13.根据权利要求1所述的系统,其中所述操纵矩阵是下采样矩阵。
14.根据权利要求1所述的系统,其中所述矩阵处理器单元包括:
第一类型寄存器,其被配置为存储所述数据矩阵的单行的值;
一组第二类型寄存器,其中每个所述第二类型寄存器被配置成存储所述操纵矩阵的不同列的值;和
多个向量计算单元,其中所述多个向量计算单元中的每一个对应于所述第二类型寄存器中的一个,并且所述向量计算单元中的每一个被配置为将存储在所述第一类型寄存器中的每个值与存储在所述第二类型寄存器中的相应一个第二类型寄存器中的相应值相乘,并且将相应向量计算单元的相乘结果相加在一起,以至少部分地确定将所述数据矩阵与所述操纵矩阵相乘的结果矩阵中的相应元素。
15.根据权利要求14所述的系统,其中所述第一类型寄存器被配置为向所述多个向量计算单元中的每一个广播内容。
16.根据权利要求14所述的系统,其中所述多个向量计算单元中的每一个包括向量乘法单元和向量加法器单元。
17.一种方法,包括:
在处理元件处接收指定数据矩阵和矩阵操纵运算的处理器指令;
基于所述处理器指令识别操纵矩阵;
将所述数据矩阵和所述操纵矩阵加载到所述处理元件的矩阵处理器单元中;
执行矩阵运算以确定结果矩阵;和
将所述结果矩阵输出到目的地位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于脸谱公司,未经脸谱公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011449371.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于呼吸治疗器具的具有减小的惯性的转动轮
- 下一篇:管道内检测地面标记模块