[发明专利]一种Inception结构的多核实现方法有效
申请号: | 201711478841.3 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108197075B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 郭阳;张军阳;杨超;田希;扈啸;李斌 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F17/15 | 分类号: | G06F17/15;G06N3/04 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 周长清 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 inception 结构 多核 实现 方法 | ||
1.一种Inception结构的多核实现方法,其特征在于,步骤为:
S1:根据多核向量处理器的核数M,单核向量处理器VPE的数量P,单核向量处理器的核内存储空间AM的存储容量V,Inception结构中单层所有卷积核的数量N,来平均分配M个核每个核可以同时完成的计算量;
S2:将N/M个卷积核依次由DDR传入M个核的核内存储空间AM中,将上一级的输出结果置入DDR中,并由标量LOAD指令从DDR中取数,并将数据广播至M个核的核内存储空间AM中;
S3:M个核同时完成N个卷积核的计算,同时得出N个输出特征图,M个核进行同步操作,完成该级所有输出特征图的计算;
S4:步骤S3的输出结果由M个核通过DMA传输至DDR中,M个核同时加载下一级的卷积核数据;
S5:从DDR中广播数据至M个核,M个核同时完成该级所有输出特征图的计算,并通过同步操作完成该级所有输出特征图的计算;
S6:重复步骤S2-S5直至完成Inception结构中所有级的计算。
2.根据权利要求1所述的Inception结构的多核实现方法,其特征在于,所述步骤S1中,根据核数M和卷积核数N平均分配任务量,若不能进行平均,多余的卷积核指定由若干个计算核进行处理。
3.根据权利要求1或2所述的Inception结构的多核实现方法,其特征在于,所述步骤S2中,卷积核数据放入核内存储空间AM中,输入数据放入DDR中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711478841.3/1.html,转载请声明来源钻瓜专利网。