[发明专利]一种卷积神经网络的数据读取方法及数据读取装置在审

专利信息
申请号: 201910547468.5 申请日: 2019-06-24
公开(公告)号: CN110059808A 公开(公告)日: 2019-07-26
发明(设计)人: 陈海波 申请(专利权)人: 深兰人工智能芯片研究院(江苏)有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/063
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 黄志华
地址: 213161 江苏省常州市武进*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 矩阵 子矩阵 计算单元 卷积神经网络 数据读取装置 读取 数据读取 卷积 权重 图像缓存器 卷积计算 权重数据 输出图像 数据总线 数量减少 图像矩阵 图像数据 一次读取 总比特数 比特数 缓存器 计算量 补零 位宽 延迟 补充
【说明书】:

发明公开了一种卷积神经网络的数据读取方法及数据读取装置,该方法包括:计算单元从图像缓存器中一次读取第一矩阵中的第一子矩阵;计算单元从每个权重缓存器中每次读取一个第二矩阵中的第二子矩阵;第一矩阵为m*(m+2)*z的矩阵,第二矩阵为n*(n+1)*z的矩阵;第一子矩阵和第二子矩阵所占的总比特数均等于数据总线的位宽比特数K;计算单元根据读取出的第一矩阵和第二矩阵作卷积计算,得到输出图像。通过这种方式,第一矩阵和第二矩阵无需在每个通道上补零,相比较于现有技术中在每个通道上补充零后的图像矩阵和卷积权重,图像数据和权重数据各自的数量减少了一倍,从而使得FPGA的计算量和延迟时间也减少了一倍,进而提高了FPGA的卷积效率。

技术领域

本发明涉及现场可编程门阵列FPGA硬件加速技术领域,尤指一种卷积神经网络的数据读取方法及数据读取装置。

背景技术

随着人工智能(AI)的不断发展,它已经从早期的人工特征工程进化到现在可以从海量数据中学习,机器视觉、语音识别以及自然语言处理等领域都取得了重大突破。卷积神经网络(Convolutional Neural Network,CNN)在人工智能领域受到越来越多的青睐,它是深度学习技术中极具代表性的网络结构之一,尤其在图像处理领域取得了很大的成功。随着网络变得越来越大、越来越复杂,需要大量的计算资源来对其进行训练,因此人们将注意力转向现场可编程门阵列(Field Programmble Gate Array,FPGA)器件,FPGA不仅具有软件的可编程性和灵活性,同时又有专用集成电路(Application Specific IntegratedCircuit,ASIC)高吞吐和低延迟的特性,而且由于具有丰富的输入/输出(I/O)接口,FPGA还非常适合用作CNN硬件加速器。CNN硬件加速器提供更多更先进的特性,比如图像分类、物体识别和追踪、人脸和语音识别、自然语言处理等,将先进的人工智能网络应用到自动化生产、控制等场景中,提高相关行业的生产力为用户带来更好的服务。

目前,FPGA在实现卷积神经网络硬件加速器时,最基本的问题就是实现卷积计算,若要实现卷积计算,则需要获取图像数据和权重数据。然而,为了提高数据的读写效率,当每个通道上的图像数据的总位宽与数据总线的位宽不相同时,一般在每个通道上补相应的零以使补零后的每个通道上的图像数据与数据总线位宽相同。对于卷积权重的每个通道上的权重数据的总位宽与数据总线的位宽不相同时,也采取了相同的方法。

但是,由于在输入的图像和卷积权重的每个通道上补了相应个数的零,增加了图像数据和权重数据的各自的数据量,从而也增加了FPGA的计算量和延迟时间,进而使得FPGA的卷积效率低。

发明内容

本发明实施例提供一种卷积神经网络的数据读取方法及数据读取装置,用以提高FPGA的卷积效率。

第一方面,本发明实施例提供一种卷积神经网络的数据读取方法,应用于现场可编程门阵列FPGA,所述FPGA包括图像缓存器、至少一个权重缓存器和计算单元,所述方法包括:

所述图像缓存器中包括待处理图像的第一矩阵,所述第一矩阵为m*(m+2)*z的矩阵;所述至少一个权重缓存器的每个权重缓存器中存储至少一个卷积权重,每个卷积权重对应一个第二矩阵,所述第二矩阵为n*(n+1)*z的矩阵;其中,所述第一矩阵为m*(m+2)*z的矩阵用于表征所述第一矩阵的高度为m、宽度为m+2、深度为z;所述第二矩阵为n*(n+1)*z的矩阵用于表征所述第二矩阵的高度为n、宽度为n+1、深度为z;m、n和z均为大于等于1的整数;

所述计算单元从所述图像缓存器中一次读取所述第一矩阵中的第一子矩阵,所述第一子矩阵为P*1*z的矩阵;其中,P为K/q/z,K为数据总线的位宽比特数,q为第一矩阵中每个元素占用的位宽比特数;所述第一子矩阵所占的总比特数等于K;所述第一子矩阵为P*1*z的矩阵用于表征所述第一子矩阵的宽度为P、高度为1、深度为z;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深兰人工智能芯片研究院(江苏)有限公司,未经深兰人工智能芯片研究院(江苏)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910547468.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top