[发明专利]执行Winograd卷积的装置与板卡在审
申请号: | 202011580624.7 | 申请日: | 2020-12-28 |
公开(公告)号: | CN114692811A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 安徽寒武纪信息科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08;G06F17/15;G06F17/16;G06N20/00 |
代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 孙新国;李波 |
地址: | 231283 安徽省合肥市高新区习友路3333*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 执行 winograd 卷积 装置 板卡 | ||
本发明涉及执行Winograd卷积的计算装置、集成电路装置及板卡,其中计算装置包括正变换单元及逆变换单元。正变换单元包括2组正变换加法器组,用以执行Winograd卷积的正变换中的加法运算;逆变换单元包括2组逆变换加法器组,用以执行Winograd卷积的逆变换中的加法运算。本发明具有保证网络精度、性能加速、面积缩减以及功耗降低的技术效果。
技术领域
本发明一般地涉及神经网络领域。更具体地,本发明涉及执行Winograd卷积的计算装置、集成电路装置及板卡。
背景技术
随着信息化时代的高速发展,人工智能与机器学习领域的研究炙手可热,相关产业蓬勃发展。卷积神经网络在计算机视觉、自动驾驶、机器翻译、语音识别、智能家居等各方面都有着广泛的作用。
卷积神经网络的参数量大,运算量大,使得卷积神经网络模型在便携移动终端有限面积和算力下被严重的限制其执行性能,同时非专用性设计的处理器在进行卷积运算时也会造成功耗的巨大开销。
Winograd卷积是一种基于多项式插值算法的卷积加速实现方式。它通过对卷积操作的两个输入:神经元及权值进行一定规模切分后,分别做线性变换,也就是Winograd正变换,再将变换后的神经元和权值进行对位乘法,把对位乘法结果再次进行线性变换,即Winograd逆变换,最后得到与原卷积操作等价的卷积结果。
由于在Winograd卷积操作的过程中,神经元和权值的正逆变换矩阵都由简单的固定数值构成,故而可以仅利用加法来实现Winograd神经元和权值的正逆变换过程。而Winograd算法中所需的乘法操作仅出现在对位乘过程中,此过程的乘法复杂度较原始卷积算法有相当程度缩减。由于硬件实现乘法运算的开销(时序、功耗、面积)比实现同位宽的加法要高很多,因此以Winograd卷积替代原始卷积操作能够带来硬件能效比和运算时间上的明显收益。
然而,目前没有一种硬件针对Winograd卷积加速算法来设计,使得现有人工智能芯片无法完全展现Winograd卷积运算的优势。因此,一种能够高效运行Winograd卷积算法的硬件设备是迫切需要的。
发明内容
为了至少部分地解决背景技术中提到的技术问题,本发明的方案提供了一种执行Winograd卷积的计算装置、集成电路装置及板卡。
在一个方面中,本发明揭露一种执行Winograd卷积的计算装置,包括正变换单元及逆变换单元。正变换单元包括2组正变换加法器组,用以执行Winograd卷积的正变换中的加法运算;逆变换单元包括2组逆变换加法器组,用以执行Winograd卷积的逆变换中的加法运算。
在另一个方面,本发明揭露一种集成电路装置,包括前述的计算装置,还揭露一种板卡,包括根据前述的集成电路装置。
本发明提出的硬件结构能够匹配Winograd卷积加速算法,具有保证网络精度、性能加速、面积缩减以及功耗降低的技术效果。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,并且相同或对应的标号表示相同或对应的部分其中:
图1是示出F(2×2,3×3)的原始卷积转换成Winograd卷积的示意图;
图2是示出本发明实施例的板卡的结构图;
图3是示出本发明实施例的集成电路装置的结构图;
图4是示出本发明实施例的计算装置的内部结构示意图;
图5是示出本发明实施例的正变换单元的示意图;
图6是示出本发明实施例的对位乘累加运算器的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽寒武纪信息科技有限公司,未经安徽寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011580624.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:嘧菌酯中间体的制备方法
- 下一篇:头戴式眼动追踪系统