[发明专利]用于卷积计算的方法、计算设备和计算机可读存储介质有效
申请号: | 202011484326.8 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112614040B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海壁仞智能科技有限公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06F17/15;G06N3/063 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 黄倩 |
地址: | 201114 上海市闵行区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 卷积 计算 方法 设备 计算机 可读 存储 介质 | ||
1.一种用于卷积计算的方法,包括:
如果确定当前周期为初始周期,从输入缓存向脉动阵列加载n*n像素的数据,所述脉动阵列包括第一预定数目行乘以第二预定数目列的处理单元,所述初始周期与初始权重相关联,n为自然数;
如果确定当前周期为初始周期之后的其他周期,基于当前周期的顺序,向脉动阵列加载一列像素的数据、一行像素的数据或者一个像素的数据;以及
如果确定完成当前周期所对应的数据加载,经由输出复用单元,在脉动阵列中的一组或多组n*n像素的数据中选择一组n*n像素的数据,以便提供至通用矩阵乘单元。
2.根据权利要求1所述的方法,其中由输入缓存向脉动阵列加载n*n像素的数据包括:
经由输入复用单元,从输入缓存向脉动阵列加载n*n像素的数据,所述输入复用单元包括多个第一输入复用单元和一个第二输入复用单元。
3.根据权利要求1所述的方法,其中基于当前周期的顺序向脉动阵列加载一列像素的数据、一行像素的数据或者一个像素的数据包括:
如果确定当前周期为第一周期,向所述脉动阵列加载第n+1列像素的数据;以及
如果确定当前周期为第二周期,向所述脉动阵列加载第n+2列像素的数据。
4.根据权利要求3所述的方法,其中基于当前周期的顺序向脉动阵列加载一列像素的数据、一行像素的数据或者一个像素的数据包括:
如果确定当前周期为第三周期或者第六周期,所述脉动阵列自下而上地脉动所述处理单元的数据;以及
经由输入复用单元,从输入缓存向所述脉动阵列加载第n行像素的数据。
5.根据权利要求4所述的方法,其中基于当前周期的顺序向脉动阵列加载一列像素的数据、一行像素的数据或者一个像素的数据包括:
如果确定当前周期为第四周期、第五周期、第七周期和第八周期中的一个周期,向脉动阵列加载一个像素的数据。
6.根据权利要求1所述的方法,其中所述第一预定数目为8,所述第二预定数目为8或者11。
7.根据权利要求1所述的方法,其中所加载的n*n像素的数据为8*8像素的数据。
8.一种计算设备,包括:
输入缓存,用于缓存待加载的数据;
输入复用单元,用于在初始周期,将来自所述输入缓存的n*n像素的待加载的数据向脉动阵列加载,以及在所述初始周期之后的其他周期,向脉动阵列加载一列像素的数据、一行像素的数据或者一个像素的数据;
脉动阵列,被配置在所述输入缓存和通用矩阵乘单元之间,所述脉动阵列包括第一预定数目行乘以第二预定数目列的处理单元;以及
输出复用单元,用于在每一个周期从所述脉动阵列中的一组或者多组n*n像素的数据中选择一组n*n像素的数据,以便提供至所述通用矩阵乘单元。
9.根据权利要求8所述的设备 ,其中所述输入复用单元包括多个第一输入复用单元和第二输入复用单元,所述第一预定数目为8,所述第二预定数目为8或者11。
10.一种存储有计算机指令的计算机可读存储介质,其中所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海壁仞智能科技有限公司,未经上海壁仞智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011484326.8/1.html,转载请声明来源钻瓜专利网。