[发明专利]多样本神经网络前向传播向量化实现方法有效
申请号: | 201911000630.8 | 申请日: | 2019-10-21 |
公开(公告)号: | CN110766157B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 刘仲;陈海燕;刘胜;田希;陈小文;雷元武;曹坤;吴立;马媛 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/063 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 周长清;胡君 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种多样本神经网络前向传播向量化实现方法,步骤包括:步骤1:将输入特征数据按照样本维优先的方式存储,以及将权重数据按照输入特征维优先的方式存储;步骤2:按列将输入特征数据集数据矩阵划分为多个矩阵块;步骤3:将权重数据矩阵传输到各个核的SM中,并将每个输入特征数据矩阵传输到各个核的AM中,通过向量化矩阵乘法和并行化矩阵乘法计算;步骤4:各个核将输出特征矩阵与偏置数据列向量进行并行加法计算;步骤5:将输出特征矩阵计算结果存储在向量处理器的片外存储器中;步骤6:重复步骤3至5,直到完成计算。本发明具有实现方法简单、能够充分发挥向量处理器计算性能且实现效率高、带宽需求小以及通用性强等优点。 | ||
搜索关键词: | 多样 神经网络 传播 量化 实现 方法 | ||
【主权项】:
1.一种多样本神经网络前向传播向量化实现方法,其特征在于,步骤包括:/n步骤1:将神经网络计算的输入特征数据按照样本维优先的方式存储,以及将权重数据按照输入特征维优先的方式存储;/n步骤2:向量处理器按列将所述输入特征数据集数据矩阵划分为多个矩阵块,得到多个输入特征数据矩阵;/n步骤3:向量处理器将所述权重数据矩阵传输到各个核的标量存储器SM中,并将所述步骤S2划分的每个输入特征数据矩阵传输到各个核的向量阵列存储器AM中,通过执行向量化矩阵乘法计算和各个核的并行化矩阵乘法计算,得到输出特征数据矩阵;/n步骤4:向量处理器的各个核将步骤3得到的所述输出特征矩阵与偏置数据列向量进行并行加法计算,得到输出特征矩阵计算结果;/n步骤5:将步骤4得到的所述输出特征矩阵计算结果存储在向量处理器的片外存储器中;/n步骤6:重复步骤3至5,直到完成全部输入特征数据矩阵计算。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911000630.8/,转载请声明来源钻瓜专利网。