[发明专利]面向向量处理器的卷积神经网络运算向量化方法有效
申请号: | 201810687639.X | 申请日: | 2018-06-28 |
公开(公告)号: | CN108985450B | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 刘仲;田希;陈海燕;郭阳;扈啸;孙永节;陈跃跃;王丽萍 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06F17/15;G06F17/16 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 周长清;胡君 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种面向向量处理器的卷积神经网络运算向量化方法,步骤包括:S1.将向量存储器的L1D设置为SRAM方式,并划分为两个缓冲区;S2.依次将输入特征数据传入到两个缓冲区中;S3.依次将卷积核数据传入到向量存储器的向量阵列中;S4.依次开启两个缓冲区的计算,每个缓冲区计算时依次选取一个移动卷积运算窗口进行卷积运算,每个移动卷积运算窗口进行运算时,依次读取一个输入特征数据并扩展为向量数据,各卷积核分别与扩展得到的向量数据进行乘累加;S5.由向量处理部件将卷积计算结果传输到片外存储中;S6.循环执行步骤S2~S5。本发明具有实现方法简单、处理器的并行性以及计算效率高等优点。 | ||
搜索关键词: | 缓冲区 卷积运算 运算 卷积神经网络 向量处理器 向量存储器 输入特征 向量数据 向量化 计算效率 结果传输 卷积计算 向量处理 向量阵列 循环执行 依次读取 并行性 卷积核 累加 移动 处理器 存储 | ||
【主权项】:
1.一种面向向量处理器的卷积神经网络运算向量化方法,其特征在于,步骤包括:S1.将向量存储器的标量存储L1D设置为SRAM方式,并根据向量处理器的体系结构特征参数、输入特征参数和卷积核参数将L1D划分为两个缓冲区以存储输入特征数据;S2.依次将输入特征数据传入到L1D的两个缓冲区中;S3.依次将卷积核数据传入到向量存储器的向量阵列中进行存储;S4.依次开启L1D中两个缓冲区的计算,每个缓冲区计算时从缓冲区中依次选取一个移动卷积运算窗口与向量阵列中存储的所述卷积核数据进行卷积运算,每个所述移动卷积运算窗口进行运算时,依次读取一个输入特征数据并扩展为向量数据,各卷积核分别从向量阵列中读取对应的所述卷积核数据后与扩展得到的向量数据进行乘累加;S5.由向量处理部件将得到的卷积计算结果传输到片外存储中;S6.循环执行步骤S2~S5,直至完成所有输入特征数据的卷积运算;所述步骤S4中每个所述移动卷积运算窗口进行运算时,具体由向量处理器的标量处理部件SPU依次从所述移动卷积运算窗口中读取一个输入特征数据,并扩展到向量处理部件的一个向量数据,得到扩展后向量数据,由向量处理部件VPU对n个卷积核依次读取对应的卷积核的一个卷积核数据后,分别与所述扩展后向量数据进行乘累加,当遍历完所述移动卷积运算窗口内所有输入特征数据后,完成当前移动卷积运算窗口的卷积计算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810687639.X/,转载请声明来源钻瓜专利网。