[发明专利]一种Inception结构的多核实现方法有效
申请号: | 201711478841.3 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108197075B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 郭阳;张军阳;杨超;田希;扈啸;李斌 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F17/15 | 分类号: | G06F17/15;G06N3/04 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 周长清 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种Inception结构的多核实现方法,其步骤为:S1:根据多核向量处理器的核数M等参数以及Inception结构中单层所有卷积核的数量N,来平均分配M个核每个核可以同时完成的计算量;S2:将N/M个卷积核依次由DDR传入M个核的核内向量存储体AM中,将上一级的输出结果置入DDR中;S3:M个核同时完成N个卷积核的计算,同时得出N个输出特征图;S4:输出结果由M个核通过DMA传输至DDR中,M个核同时加载下一级的卷积核数据;S5:从DDR中广播数据至M个核,完成该级所有输出特征图的计算;S6:重复步骤,直至完成Inception结构中所有级的计算。本发明具有实现简单、操作方便、可提高多核处理器的并行性、加速GoogleNet网络模型的计算速度、提高多核处理器计算效率等优点。 | ||
搜索关键词: | 一种 inception 结构 多核 实现 方法 | ||
【主权项】:
1.一种Inception结构的多核实现方法,其特征在于,步骤为:S1:根据多核向量处理器的核数M,单核向量处理器VPE的数量P,单核向量处理器的核内存储空间AM的存储容量V,Inception结构中单层所有卷积核的数量N,来平均分配M个核每个核可以同时完成的计算量;S2:将N/M个卷积核依次由DDR传入M个核的核内向量存储体AM中,将上一级的输出结果置入DDR中,并由标量LOAD指令从DDR中取数,并将数据广播至M个核的核内AM中;S3:M个核同时完成N个卷积核的计算,同时得出N个输出特征图,M个核进行同步操作,完成该级所有输出特征图的计算;S4:步骤S3的输出结果由M个核通过DMA传输至DDR中,M个核同时加载下一级的卷积核数据;S5:从DDR中广播数据至M个核,M个核同时完成该级所有输出特征图的计算,并通过同步操作完成该级所有输出特征图的计算;S6:重复步骤S2‑S5直至完成Inception结构中所有级的计算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711478841.3/,转载请声明来源钻瓜专利网。