[发明专利]一种卷积神经网络的数据读取方法及数据读取装置在审
申请号: | 201910547468.5 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110059808A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 陈海波 | 申请(专利权)人: | 深兰人工智能芯片研究院(江苏)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 213161 江苏省常州市武进*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种卷积神经网络的数据读取方法及数据读取装置,该方法包括:计算单元从图像缓存器中一次读取第一矩阵中的第一子矩阵;计算单元从每个权重缓存器中每次读取一个第二矩阵中的第二子矩阵;第一矩阵为m*(m+2)*z的矩阵,第二矩阵为n*(n+1)*z的矩阵;第一子矩阵和第二子矩阵所占的总比特数均等于数据总线的位宽比特数K;计算单元根据读取出的第一矩阵和第二矩阵作卷积计算,得到输出图像。通过这种方式,第一矩阵和第二矩阵无需在每个通道上补零,相比较于现有技术中在每个通道上补充零后的图像矩阵和卷积权重,图像数据和权重数据各自的数量减少了一倍,从而使得FPGA的计算量和延迟时间也减少了一倍,进而提高了FPGA的卷积效率。 | ||
搜索关键词: | 矩阵 子矩阵 计算单元 卷积神经网络 数据读取装置 读取 数据读取 卷积 权重 图像缓存器 卷积计算 权重数据 输出图像 数据总线 数量减少 图像矩阵 图像数据 一次读取 总比特数 比特数 缓存器 计算量 补零 位宽 延迟 补充 | ||
【主权项】:
1.一种卷积神经网络的数据读取方法,应用于现场可编程门阵列FPGA,所述FPGA包括图像缓存器、至少一个权重缓存器和计算单元,其特征在于,所述方法包括:所述图像缓存器中包括待处理图像的第一矩阵,所述第一矩阵为m*(m+2)*z的矩阵;所述至少一个权重缓存器的每个权重缓存器中存储至少一个卷积权重,每个卷积权重对应一个第二矩阵,所述第二矩阵为n*(n+1)*z的矩阵;其中,所述第一矩阵为m*(m+2)*z的矩阵用于表征所述第一矩阵的高度为m、宽度为m+2、深度为z;所述第二矩阵为n*(n+1)*z的矩阵用于表征所述第二矩阵的高度为n、宽度为n+1、深度为z;m、n和z均为大于等于1的整数;所述计算单元从所述图像缓存器中一次读取所述第一矩阵中的第一子矩阵,所述第一子矩阵为P*1*z的矩阵;其中,P为K/q/z,K为数据总线的位宽比特数,q为第一矩阵中每个元素占用的位宽比特数;所述第一子矩阵所占的总比特数等于K;所述第一子矩阵为P*1*z的矩阵用于表征所述第一子矩阵的宽度为P、高度为1、深度为z;所述计算单元从每个权重缓存器中每次读取一个第二矩阵中的第二子矩阵,所述第二子矩阵为P*1*z的矩阵;其中,P为K/q/z,q为第二矩阵中每个元素占用的位宽比特数;所述第二子矩阵所占的总比特数等于K;所述第二子矩阵为P*1*z的矩阵用于表征所述第二子矩阵的宽度为P、高度为1、深度为z;所述计算单元根据读取出的所述第一矩阵和第二矩阵作卷积计算,得到输出图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深兰人工智能芯片研究院(江苏)有限公司,未经深兰人工智能芯片研究院(江苏)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910547468.5/,转载请声明来源钻瓜专利网。
- 上一篇:图像处理方法、装置和存储介质
- 下一篇:一种计算装置及相关产品