[发明专利]一种用于执行矩阵加/减运算的装置和方法有效
申请号: | 201610266805.X | 申请日: | 2016-04-26 |
公开(公告)号: | CN107315715B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 张潇;刘少礼;陈天石;陈云霁 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕雁葭 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 执行 矩阵 运算 装置 方法 | ||
1.一种用于根据矩阵运算指令执行矩阵加减运算的装置,其特征在于,所述矩阵运算指令包括操作域,所述操作域用于指示矩阵运算相关的标量数据,所述标量数据包括矩阵运算指令相关的输入矩阵地址、输入矩阵长度,所述装置包括:
存储单元,用于存储矩阵数据;
寄存器单元,用于存储标量数据;
矩阵运算单元,用于根据译码后的矩阵运算指令,根据该标量数据在存储单元中获取具有所述输入矩阵长度的矩阵数据,对输入矩阵进行矩阵加减运算操作;
所述矩阵运算单元包括多个并行的标量加减运算器,其中:
在执行矩阵加减运算的过程中,对于具有所述输入矩阵长度的两输入矩阵,运算单元依次读入一预设长度的矩阵数据,该长度等于标量加减运算器的个数,对应的数据在对应的标量加减运算器中执行加减法运算,每次计算矩阵数据中的一部分,并最终完成整个矩阵的加减法运算;以及
在执行矩阵加减标量的过程中,矩阵运算单元首先根据指令从指令中直接读取或根据指令提供的寄存器号从寄存器单元中取出该标量数据,矩阵运算单元将所述标量扩展成与标量加减运算器个数等宽的向量数据,作为标量加减运算器的一个输入,另一输入为从存储单元读取的一预设长度的矩阵数据,与标量扩展后得到的向量数据执行加减法运算。
2.根据权利要求1所述的装置,其特征在于,还包括控制单元,用于对矩阵运算指令进行译码,并控制矩阵运算指令的运算过程。
3.如权利要求1所述的装置,其特征在于,所述寄存器单元所存储的标量数据还包括矩阵运算指令相关的输出矩阵地址以及矩阵加减标量运算用到的标量数据。
4.如权利要求2所述的装置,其特征在于,所述控制单元包括:
指令队列模块,用于对译码后的矩阵运算指令进行顺序存储,并获取矩阵运算指令相关的标量数据。
5.如权利要求2所述的装置,其特征在于,所述控制单元包括:
依赖关系处理单元,用于在矩阵运算单元获取当前矩阵运算指令前,判断当前矩阵运算指令与之前未执行完的矩阵运算指令是否存在依赖关系。
6.如权利要求2所述的装置,其特征在于,所述控制单元包括:
存储队列模块,用于在当前矩阵运算指令与之前未执行完的运算指令存在依赖关系时,暂时存储当前矩阵运算指令,并且在该依赖关系消除时,将暂存的矩阵运算指令送往矩阵运算单元。
7.如权利要求1-6任一项所述的装置,其特征在于,所述装置还包括:
指令缓存单元,用于存储待执行的矩阵运算指令;
输入输出单元,用于将矩阵运算指令相关的矩阵数据存储于存储单元,或者,从存储单元中获取矩阵运算指令的运算结果。
8.如权利要求1所述的装置,其特征在于,所述矩阵运算指令还包括操作码;
所述操作码用于指示执行矩阵运算操作;
所述操作域包括立即数和/或寄存器号,指示矩阵运算相关的标量数据,其中寄存器号用于指向所述寄存器单元地址。
9.根据权利要求8所述的装置,其特征在于,所述矩阵运算指令包括以下至少一种:
矩阵加法指令,根据该指令,从存储单元的指定地址取出指定大小的矩阵数据,在矩阵运算单元中进行矩阵加法运算,并将计算结果写回至存储单元的指定地址;
矩阵减法指令,根据该指令,从存储单元的指定地址取出指定大小的矩阵数据,在矩阵运算单元中进行矩阵减法运算,并将计算结果写回至存储单元的指定地址;
矩阵加标量指令,根据该指令,从存储单元的指定地址取出指定大小的矩阵数据,从寄存器单元的指定地址中取出标量数据,在矩阵运算单元中进行矩阵加标量的运算,并将计算结果写回至存储单元的指定地址;
矩阵减标量指令,根据该指令,从存储单元的指定地址取出指定大小的矩阵数据,从寄存器单元的指定地址中取出标量数据,在矩阵运算单元中进行矩阵减标量的运算,并将计算结果写回至存储单元的指定地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610266805.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种去卷积功率谱估计方法
- 下一篇:一种用于执行向量外积运算的装置和方法