[发明专利]对张量进行图块遍历以进行卷积运算的方法和装置在审
申请号: | 202010583620.8 | 申请日: | 2020-06-24 |
公开(公告)号: | CN112395547A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 雅尼夫·费斯;摩西·马奥 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F17/15 | 分类号: | G06F17/15;G06F13/28;G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 宗晓斌 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 张量 进行 遍历 卷积 运算 方法 装置 | ||
1.一种对输入张量执行卷积的装置,所述装置包括:
参数生成器,用于执行以下操作:
基于内核参数或层参数中的至少一者生成用于所述输入张量的水平维度的水平硬件执行参数,并且
基于所述内核参数或所述层参数中的至少一者生成用于所述输入张量的垂直维度的垂直硬件执行参数;
加速器接口,用于基于所述水平硬件执行参数和所述垂直硬件执行参数配置硬件加速器电路;
水平迭代器控制器,用于确定所述硬件加速器电路何时完成所述卷积的第一水平迭代;以及
垂直迭代器控制器,用于确定所述硬件加速器电路何时完成所述卷积的第一垂直迭代。
2.根据权利要求1所述的装置,其中,所述层参数包括所述输入张量的输入维度大小参数,所述内核参数包括所述输入张量的图块的图块维度大小参数,并且所述硬件执行参数包括所述图块的微图块的输入深度大小参数。
3.根据权利要求1所述的装置,其中,所述水平硬件执行参数用于将所述硬件加速器电路配置为执行所述卷积的所述第一水平迭代,并且所述垂直硬件执行参数用于将所述硬件加速器电路配置为执行所述卷积的所述第一垂直迭代。
4.根据权利要求1所述的装置,其中:
所述参数生成器用于基于所述内核参数或所述层参数中的至少一者生成用于所述输入张量的微图块的深度维度的深度硬件执行参数;并且
所述加速器接口用于将所述硬件加速器电路配置为基于所述深度硬件执行参数执行所述卷积。
5.根据权利要求1-4中任一项所述的装置,还包括:深度迭代器控制器,用于确定所述硬件加速器电路何时完成所述卷积的第一深度迭代,所述参数生成器用于在所述硬件加速器电路完成所述卷积的所述第一深度迭代时生成经更新的深度硬件执行参数,所述经更新的深度硬件执行参数用于将所述硬件加速器电路配置为执行所述卷积的第二深度迭代。
6.根据权利要求1所述的装置,其中:
所述参数生成器还用于执行以下操作:
在所述硬件加速器电路完成水平迭代时生成经更新的水平硬件执行参数;并
在所述硬件加速器电路完成所述卷积的垂直迭代时生成经更新的垂直硬件执行参数;并且
所述加速器接口还用于执行以下操作:
在所述硬件加速器电路中配置所述经更新的水平硬件执行参数以执行所述卷积的第二水平迭代;并
在所述硬件加速器电路中配置所述经更新的垂直硬件执行参数以执行所述卷积的第二垂直迭代。
7.根据权利要求1所述的装置,还包括:图形编译器,用于基于所述输入张量的所述层参数来生成所述内核参数。
8.根据权利要求1所述的装置,还包括:
所述硬件加速器电路;以及
与所述硬件加速器电路通信的可编程控制器,所述可编程控制器包括所述参数生成器、所述加速器接口、所述水平迭代器控制器和所述垂直迭代器控制器。
9.一种具有指令的非暂态计算机可读存储介质,所述指令在由控制器执行时,使所述控制器至少执行以下操作:
基于内核参数或层参数中的至少一者生成用于输入张量的水平维度的水平硬件执行参数;
基于所述内核参数或所述层参数中的至少一者生成用于所述输入张量的垂直维度的垂直硬件执行参数;
基于所述水平硬件执行参数和所述垂直硬件执行参数配置硬件加速器电路;
确定所述硬件加速器电路何时完成所述卷积的第一水平迭代;以及
确定所述硬件加速器电路何时完成所述卷积的第一垂直迭代。
10.根据权利要求9所述的非暂态计算机可读存储介质,其中,所述层参数包括所述输入张量的输入维度大小参数,所述内核参数包括所述输入张量的图块的图块维度大小参数,并且所述硬件执行参数包括所述图块的微图块的输入深度大小参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010583620.8/1.html,转载请声明来源钻瓜专利网。