[发明专利]使用矩阵计算单元的深度级联有效
申请号: | 201810188352.2 | 申请日: | 2018-03-07 |
公开(公告)号: | CN108572940B | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 威廉·约翰·格兰德;雷吉纳尔德·克利福德·扬 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06N3/06 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 矩阵 计算 单元 深度 级联 | ||
1.一种用于深度级联的方法,包括:
接收使用集成电路处理到神经网络的网络输入的请求,所述集成电路使用矩阵计算单元在硬件中执行神经网络计算,所述神经网络包括深度级联神经网络层,所述深度级联神经网络层规范具有维度x1乘y1乘z1的输入张量和具有维度x1乘y1乘z2的输入张量沿深度维度的级联以生成具有维度x1乘y1乘(z1+z2)的输出张量;以及
生成指令,所述指令在由所述集成电路执行时使得所述集成电路在由所述神经网络处理网络输入期间,通过执行包括以下的操作来生成满足所述深度级联神经网络层的规范的层输出张量:
针对到所述深度级联神经网络层的具有维度x1乘y1乘z1的第一输入张量以及到所述深度级联神经网络层的具有维度x1乘y1乘z2的第二输入张量中的每个空间位置:
使用所述矩阵计算单元,将所述第二输入张量中的所述空间位置的第二深度矢量与所述深度级联神经网络层的移位权重矩阵相乘以生成移位的第二深度矢量,所述移位的第二深度矢量以零作为前z1项以及所述第二深度矢量的前z2项作为后z2项,其中,所述空间位置的所述第二深度矢量是包括所述第二输入张量中处于所述空间位置的所有项并且具有填充值作为所述第二深度矢量的任何剩余值的矢量;以及
将所述移位的第二深度矢量和所述第一输入张量中的所述空间位置的第一输入深度矢量相加以生成级联深度矢量,所述级联深度矢量以所述第一输入深度矢量的前z1项作为前z1项并且以所述移位的第二深度矢量的后z2项作为后z2项,其中,所述空间位置的所述第一输入深度矢量是包括所述第一输入张量中处于所述空间位置的所有项并将填充值作为所述第一输入深度矢量的任何剩余值的矢量。
2.如权利要求1所述的方法,所述操作还包括:
将所述第一输入深度矢量移动到所述矩阵计算单元的输出求和寄存器集合;以及
其中,将所述移位的第二深度矢量和所述第一输入深度矢量相加包括:
在将所述第一输入深度矢量存储在所述矩阵计算单元的所述输出求和寄存器集合中的同时,将所述移位的第二深度矢量移入所述矩阵计算单元的所述输出求和寄存器集合。
3.如权利要求2所述的方法,其中,移动所述第一输入深度矢量包括:
使用所述矩阵计算单元,将所述第一输入深度矢量与所述深度级联神经网络层的修改的单位权重矩阵相乘。
4.如权利要求3所述的方法,还包括:
为所述深度级联神经网络层生成所述修改的单位权重矩阵;以及
将所述深度级联神经网络层的所述修改的单位权重矩阵存储在专用集成电路能访问的存储器中。
5.如权利要求1所述的方法,还包括:
为所述深度级联神经网络层生成所述移位权重矩阵;以及
将所述深度级联神经网络层的所述移位权重矩阵存储在专用集成电路能访问的存储器中。
6.如权利要求5所述的方法,还包括:
确定所述输出张量中的深度维数不超过所述矩阵计算单元的最大矢量长度;以及
响应于确定所述输出张量中的深度维数不超过所述矩阵计算单元的所述最大矢量长度,为所述深度级联神经网络层生成所述移位权重矩阵。
7.如权利要求1所述的方法,其中,所述深度级联神经网络层的所述移位权重矩阵是(z1+z2)乘(z1+z2)的矩阵,该矩阵除了从该矩阵的第z2列的第一项开始的右向对角线上的项为一之外其余项均为零。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810188352.2/1.html,转载请声明来源钻瓜专利网。