[发明专利]图形处理器在审
申请号: | 202010640113.3 | 申请日: | 2020-07-06 |
公开(公告)号: | CN111798363A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 张炜;顾德明 | 申请(专利权)人: | 上海兆芯集成电路有限公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 徐协成 |
地址: | 201203 上海市张*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图形 处理器 | ||
1.一种图形处理器,包括:
稀疏矩阵检测单元,读取存储器中的多个矩阵,判断所述矩阵的每一个是否为零矩阵或非零矩阵,并输出判断结果;
寄存器文件(register file),存储来自该稀疏矩阵检测单元的所述矩阵;
断言寄存器,依据该判断结果,对所述矩阵进行标记,并输出标记结果;
矩阵运算单元,接收矩阵运算指令,以及依据该标记结果,从该寄存器文件中读取所述矩阵中的所述非零矩阵,并且对所述非零矩阵执行矩阵运算。
2.如权利要求1所述的图形处理器,还包括:
线程调度及指令分发单元,发送整数运算指令及该矩阵运算指令;
整数运算单元,接收该整数运算指令及该矩阵运算指令;依据该整数运算指令执行整数运算,并且将该矩阵运算指令转传送给该矩阵运算单元。
3.如权利要求1所述的图形处理器,其中,该矩阵运算单元包括:
控制单元,从该断言寄存器读取所述矩阵的该标记结果,并且依据该标记结果,从该寄存器文件中读取所述矩阵中的所述非零矩阵;
多个运算子单元,对所述非零矩阵执行矩阵运算;
累加单元,存储所述运算子单元在执行矩阵运算中的矩阵子乘积值及矩阵运算结果;其中,该矩阵乘积值供所述运算子单元执行矩阵运算使用。
4.如权利要求1所述的图形处理器,其中,该矩阵运算单元依据该标记结果,从该寄存器文件中忽略所述零矩阵。
5.如权利要求1所述的图形处理器,其中,当完成矩阵运算时,该控制单元从该累加单元中读取该矩阵运算结果,并且将该矩阵运算结果写入该寄存器文件中。
6.如权利要求1所述的图形处理器,其中,该断言寄存器以一位来标记所述矩阵中的所述零矩阵及所述非零矩阵。
7.如权利要求6所述的图形处理器,其中,该断言寄存器将所述矩阵中的所述零矩阵标记为“0”,并且将所述矩阵中的所述非零矩阵标记为“1”。
8.一种矩阵运算的加速方法,适用于图形处理器,包括:
接收矩阵运算指令;
从存储器中读取多个矩阵,并且判断每一个所述矩阵是否为零矩阵或非零矩阵,并输出判断结果;
依据该判断结果,对所述矩阵进行标记,并输出标记结果;
依据该标记结果,读取所述矩阵中的所述非零矩阵,并且对所述非零矩阵执行矩阵运算。
9.如权利要求8所述的加速方法,还包括:
依据该标记结果,忽略所述矩阵中的所述零矩阵。
10.如权利要求8所述的加速方法,其中,依据该判断结果,对所述矩阵进行标记,包括:
以一位来标记所述矩阵中的所述零矩阵及所述非零矩阵。
11.如权利要求10所述的加速方法,其中,以一位来标记所述矩阵中的所述零矩阵及所述非零矩阵包括:
将所述矩阵中的所述零矩阵标记为“0”,并且将所述矩阵中的所述非零矩阵标记为“1”。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海兆芯集成电路有限公司,未经上海兆芯集成电路有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010640113.3/1.html,转载请声明来源钻瓜专利网。