[发明专利]一种深度卷积加速器及其实现加速深度卷积的方法在审
申请号: | 202110352179.7 | 申请日: | 2021-03-31 |
公开(公告)号: | CN115145839A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 刘锴;宋宁;王铜铜;杜金凤;詹宁斯·格兰特 | 申请(专利权)人: | 广东高云半导体科技股份有限公司 |
主分类号: | G06F12/0877 | 分类号: | G06F12/0877;G06N3/06 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 李丹 |
地址: | 510700 广东省广州市黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 卷积 加速器 及其 实现 加速 方法 | ||
本申请公开了一种深度卷积加速器及其实现加速深度卷积的方法,通过根据深度卷积运算的输入信息计算出了当前参与深度卷积的深度卷积节点的数量,实现了深度卷积加速器的卷积节点数目的动态配置,从而增强了深度卷积加速器的卷积节点数目的可配置性,解决了相关技术中深度卷积加速器的卷积节点数目不可配置、特定应用场景专用的问题,提高了深度卷积加速器对各种不同应用场景的适应性,提升了深度卷积加速器的灵活性和广泛性,适应了复杂多变的AI使用场景。
技术领域
本申请涉及但不限于人工智能(AI,Artificial Intelligence)技术,尤指一种深度卷积加速器及其实现加速深度卷积的方法。
背景技术
随着AI技术的发展与广泛应用,对不同场景下的AI计算提出了越来越大的挑战。AI计算的应用从一开始的云端逐渐扩展到边缘端。在边缘端的应用,根据使用场景不同,对AI的需求也是千变万化。
为了适应不同的应用需求,深度卷积加速器的应用灵活性和广泛性亟需提升,以更好的适应复杂多变的AI使用场景。
发明内容
本申请提供一种深度卷积加速器及其实现加速深度卷积的方法,能够提升深度卷积加速器的应用灵活性和广泛性,适应复杂多变的AI使用场景。
本发明实施例提供了一种深度卷积加速器,包括:深度卷积计算模块、地址发生器、深度卷积器,其中,
深度卷积计算模块,设置为根据深度卷积运算的输入信息,计算深度卷积节点的数量n和偏置数据;
地址发生器,包括n个,设置为产生输入数据的地址、深度卷积核数据的地址以及输出数据的地址;
深度卷积器,包括n个,设置为根据偏置数据、输入数据的地址和深度卷积核数据的地址分别读取的输入数据和深度卷积核数据,实现深度卷积运算并将运算结果输出至输出数据的地址;
其中,一个地址发生器和一个深度卷积器构成一个深度卷积节点,n个深度卷积节点并行处理。
在一种示例性实例中,还包括:第一缓存器、第二缓存器、第三缓存器,其中,
第一缓存器,设置为存储所述深度卷积运算的输入信息;
第二缓存器,设置为存储深度卷积运算值的所述偏置数据;
第三缓存器,设置为存储深度卷积核数据。
在一种示例性实例中,还包括:地址选择器、第四缓存器,其中,
地址选择器,设置为根据不同地址将数据写入到相应数据缓存器的不同位置;
第四缓存器,设置为存储所述输出数据。
在一种示例性实例中,所述深度卷积计算模块设置为:
根据所述深度卷积运算的输入信息中的被深度卷积数据的高H、深度卷积核的高h以及步长stride,计算当前参与并行运算的所述深度卷积节点的数量n;将预先设置的加一计数器的值与计算的到的n的值进行取余运算,运算结果作为所述地址偏置。
在一种示例性实例中,所述根据深度卷积运算的输入信息,计算当前参与并行运算的所述深度卷积节点的数量n,包括:
按照以下公式,根据所述深度卷积运算的输入信息中的被深度卷积数据的高H、深度卷积核的高h以及步长stride,计算当前参与并行运算的所述深度卷积节点的数量n:n=[(H-h)/stride]+1。
在一种示例性实例中,所述地址发生器包括:深度卷积核Y计数器、深度卷积核X计数器、输入通道计数器、输入Y计数器、深度卷积核加法器、输出加法器、输入加法器,其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东高云半导体科技股份有限公司,未经广东高云半导体科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110352179.7/2.html,转载请声明来源钻瓜专利网。