[发明专利]子矩阵运算装置及方法有效
申请号: | 201810236769.1 | 申请日: | 2016-04-22 |
公开(公告)号: | CN108491359B | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 刘少礼;张潇;陈云霁;陈天石 | 申请(专利权)人: | 北京中科寒武纪科技有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 11606 北京华进京联知识产权代理有限公司 | 代理人: | 王程 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子矩阵 运算指令 运算装置 运算 存储单元 加减乘除运算 寄存器单元 矩阵 乘法指令 加法指令 减法指令 向量指令 运算过程 运算结果 运算效率 种子矩阵 有效地 乘子 向量 指令 灵活 | ||
本发明提供了一种子矩阵运算装置及方法,上述方法包括如下步骤:获取子矩阵运算指令,子矩阵运算指令包括张量运算指令、子矩阵乘向量指令、向量乘子矩阵指令、子矩阵加法指令、子矩阵减法指令以及子矩阵乘法指令中的至少一种;根据子矩阵运算指令分别从寄存器单元中获取第一子矩阵信息和第二子矩阵信息;根据第一子矩阵信息从存储单元中获取第一子矩阵数据,根据第二子矩阵信息从存储单元中获取第二子矩阵数据;根据第一子矩阵数据和第二子矩阵数据进行子矩阵运算,获得子矩阵运算结果。本发明的子矩阵运算装置及方法,使得子矩阵运算过程中可以更加灵活有效地支持不同宽度的数据,提高了张量运算及子矩阵加减乘除运算等运算的运算效率。
本申请是申请日为2016年04月22日、申请号为201610258546.6、专利名称为“一种子矩阵运算装置及方法”的分案申请。
技术领域
本发明属于计算机领域,尤其涉及一种子矩阵运算装置及方法。
背景技术
当前计算机领域有越来越多的算法涉及到矩阵运算,包括人工神经网络算法和图形的渲染算法。与此同时,作为矩阵运算中的一个重要组成部分,子矩阵运算也越来越频繁的出现在各种计算任务中。所以对于那些面向解决矩阵运算问题的方案,必须同时考虑子矩阵运算实现的效率和难度。
在现有技术中一种进行子矩阵运算的已知方案是使用通用处理器,该方法通过通用寄存器堆和通用功能部件来执行通用指令,从而执行子矩阵运算。然而,该方法的缺点之一是单个通用处理器多用于标量计算,在进行子矩阵运算时运算性能较低。而使用多个通用处理器并行执行时,通用处理器之间的相互通讯又有可能成为性能瓶颈,同时,实现子矩阵运算的代码量也大于正常的矩阵运算。
在另一种现有技术中,使用图形处理器(GPU)来进行子矩阵计算,其中,通过使用通用寄存器堆和通用流处理单元执行通用SIMD(Single Instruction Multiple Data,单指令多数据流)指令来进行子矩阵运算。然而,上述方案中,GPU片上缓存太小,在进行大规模子矩阵运算时需要不断进行片外数据搬运,片外带宽成为了主要性能瓶颈。
在另一种现有技术中,使用专门定制的矩阵运算装置来进行子矩阵计算,其中,使用定制的寄存器堆和定制的处理单元进行子矩阵运算。然而,目前已有的专用矩阵运算装置受限于寄存器堆,子矩阵数据通常具有特定的规模,不能够灵活地支持不同长度的子矩阵运算。
综上所述,现有的不管是片上多核通用处理器、片间互联通用处理器(单核或多核)、还是片间互联,图形处理器都无法进行高效的子矩阵运算,并且这些现有技术在处理子矩阵运算问题时存在着代码量大,受限于片间通讯,片上缓存不够,支持的子矩阵规模不够灵活等问题。
发明内容
基于此,本发明提供一种子矩阵运算装置及方法,能配合子矩阵运算指令集,能够满足不同规模子矩阵数据的运算过程,高效地实现张量运算指令、子矩阵乘向量指令、向量乘子矩阵指令及子矩阵加减乘除等运算。
一种子矩阵运算方法,所述方法包括:
获取子矩阵运算指令,其中,所述子矩阵运算指令包括张量运算指令、子矩阵乘向量指令、向量乘子矩阵指令、子矩阵加法指令、子矩阵减法指令以及子矩阵乘法指令中的至少一种;
根据所述子矩阵运算指令分别从寄存器单元中获取第一子矩阵信息和第二子矩阵信息;
根据所述第一子矩阵信息从存储单元中获取第一子矩阵数据,根据所述第二子矩阵信息从所述存储单元中获取第二子矩阵数据;
根据所述第一子矩阵数据和所述第二子矩阵数据进行子矩阵运算,获得子矩阵运算结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科寒武纪科技有限公司,未经北京中科寒武纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810236769.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种变压器套管状态评估方法及装置
- 下一篇:一种采煤量的计算方法