[发明专利]小通道下卷积层的硬件加速方法及电路在审
申请号: | 202211312777.2 | 申请日: | 2022-10-25 |
公开(公告)号: | CN116308988A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 李静 | 申请(专利权)人: | 北京芯辰科技有限公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06V10/44;G06V10/82;G06N3/08;G06N3/0464 |
代理公司: | 苏州中合知识产权代理事务所(普通合伙) 32266 | 代理人: | 阮梅 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通道 卷积 硬件加速 方法 电路 | ||
1.小通道下卷积层的硬件加速方法,其特征在于,包括如下步骤:
将输入特征图以及卷积核参数的数据进行排列转换并存储,所述排列转换为将同一层中前一列数据和后一列数据依次首尾相接形成一列数据;
在存储的排列转换后的输入特征图以及对应的卷积核参数数据中依次提取运算所需的数据;
基于每次提取的排列转换后的输入特征图以及对应的卷积核参数的数据进行卷积运算,获取单次的卷积结果;
按照原始输入特征图每次卷积运算过程所涉及的数据来对应查找排列转换后的输入特征图相对应的数据卷积运算所获得的卷积结果,将所述所获得的卷积结果进行合并存储即为输出特征图的中间结果。
2.根据权利要求1所述的小通道下卷积层的硬件加速方法,其特征在于,将输入特征图或卷积核排列转换后所形成的每一列数据单独存储于一个地址内。
3.根据权利要求1所述的小通道下卷积层的硬件加速方法,其特征在于,所述依次提取运算所需的数据,具体包括如下步骤:
从存储的输入特征图以及对应的卷积核参数的数据中按照从左至右,从上至下的方式依次提取运算所需的数据。
4.根据权利要求3所述的小通道下卷积层的硬件加速方法,其特征在于,若存储的排列转换后的输入特征图中一列数据的数据量大于每次提取的运算所需的数据量时,则在每列数据上做移位操作依次提取,直至完每列数据中最后的一个数据为止。
5.小通道下卷积层的硬件加速电路,其特征在于,包括:转换模块、提取模块、运算模块和储存模块,其中,
所述转换模块,用于将输入特征图以及卷积核参数的数据进行排列转换并存储,所述排列转换为将同一层中前一列数据和后一列数据依次首尾相接形成一列数据;
所述提取模块,用于在存储的排列转换后的输入特征图以及对应的卷积核参数数据中依次提取运算所需的数据;
所述运算模块,用于基于每次提取的排列转换后的输入特征图以及对应的卷积核参数的数据进行卷积运算,获取单次的卷积结果;
所述储存模块,用于按照原始输入特征图每次卷积运算过程所涉及的数据来对应查找排列转换后的输入特征图相对应的数据卷积运算所获得的卷积结果,将所述所获得的卷积结果进行合并存储即为输出特征图的中间结果。
6.根据权利要求5所述的小通道下卷积层的硬件加速电路,其特征在于,还包括寄存器,用于将输入特征图或卷积核排列转换后所形成的每一列数据单独存储于一个地址内。
7.根据权利要求5所述的小通道下卷积层的硬件加速电路,其特征在于,所述提取模块是从存储的输入特征图以及对应的卷积核参数的数据中按照从左至右,从上至下的方式依次提取运算所需的数据。
8.根据权利要求7所述的小通道下卷积层的硬件加速电路,其特征在于,若存储的排列转换后的输入特征图中一列数据的数据量大于每次提取的运算所需的数据量时,则基于预设位移位在存储的每列数据上做移位操作依次提取,直至完每列数据中最后的一个数据为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京芯辰科技有限公司,未经北京芯辰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211312777.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可佩戴物体
- 下一篇:三段式液压机械无级传动装置的控制系统