[发明专利]用于神经网络的计算平台实现方法及系统在审
申请号: | 201810297916.6 | 申请日: | 2018-03-30 |
公开(公告)号: | CN110321064A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 隋凌志;王雨顺;刘鑫 | 申请(专利权)人: | 北京深鉴智能科技有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 张阳 |
地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 外部存储器 读取 缓存 计算平台 存储 神经网络 数据执行 特征图 操作结果 读取操作 数据搬运 整体处理 | ||
1.一种用于神经网络的计算平台实现方法,所述计算平台从外部存储器读取所需数据,并且在片上缓存中缓存读取的所述数据以及各操作的中间计算结果,所述方法包括:
从所述外部存储器读取第一操作所需特征图的第一部分数据,针对所述第一部分数据执行包括第一操作和至少一项其他操作,将针对所述第一部分数据的操作结果存储回所述外部存储器;
从所述外部存储器读取第一操作所需特征图的第二部分数据,针对所述第二部分数据执行上述从所述外部存储器的读取操作、所述第一操作和所述至少一项其他操作、以及存储回所述外部存储器的操作。
2.如权利要求1所述的方法,其中,所述特征图包括第一部分数据和至少一个第二部分数据,并且所述方法包括:
针对每个第二部分数据,分别执行上述从所述外部存储器的读取操作、所述第一操作以及所述至少一项其他操作以及存储回所述外部存储器的操作,其中针对所述第一部分数据和所述至少一个第二部分数据的操作结果等价于针对所述特征图顺序执行所述第一操作以及至少一项其他操作的操作结果。
3.如权利要求1所述的方法,其中,每次从所述外部存储器读取的部分数据的大小至少部分基于所述片上缓存的容量确定。
4.如权利要求1所述的方法,其中,所述至少一个其他操作是如下至少一项:
所述第一操作的至少一个后续操作,所述后续操作至少需要所述第一操作的完整计算结果以其完成全部操作;以及
与所述第一操作具有相同特征图输入的至少一个横向操作。
5.如权利要求4所述的方法,其中,所述第一操作和至少一个其他操作包括相继的卷积(CONV)操作、非线性(ReLU)操作和池化(POOL)操作。
6.如权利要求4所述的方法,还包括:
从所述外部存储器读取第一后续操作所需的来自其他特征图的部分数据,针对来自其他特征图的部分数据和来自所述特征图的部分数据,执行所述第一后续操作。
7.如权利要求6所述的方法,其中,所述第一后续操作是点乘(ELTWISE)操作。
8.如权利要求4所述的方法,还包括:
将第二后续操作并入第一操作。
9.如权利要求8所述的方法,其中,所述第二后续操作是批量归一化(BatchNorm)和定标(Scale)操作,所述第一操作是CONV操作。
10.如权利要求1所述的方法,还包括:
将操作结果以所需的维度排列方式存回所述外部存储器,和/或以所需的维度排列方式从所述外部存储器中读取在前操作结果,以省略神经网络中仅用于改变数据维度或排列方式的操作。
11.如权利要求10所述的方法,其中,被省略的操作是如下的至少一项:
级联(CONCAT)操作;以及
平坦化(FLATTEN)操作。
12.如权利要求1所述的方法,还包括:
分解所述第一操作和/或所述至少一项其他操作,其中分解后的所述第一操作和/或至少一项其他操作针对的是其各自原始输入的一部分。
13.如权利要求12所述的方法,其中,分解后的所述第一操作和/或至少一项其他操作是经拆分的CONV操作,并且每个经拆分的CONV操作的输入是原特征图的一部分。
14.如权利要求12所述的方法,其中,分解后的所述第一操作和/或至少一项其他操作是经拆分的POOL操作,并且每个经拆分的POOL操作的输入是在前操作的完整特征图输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深鉴智能科技有限公司,未经北京深鉴智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810297916.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法及存储设备
- 下一篇:存储装置及计算机系统