[发明专利]网络处理器和网络运算方法在审
申请号: | 201811423421.X | 申请日: | 2018-04-04 |
公开(公告)号: | CN109359736A | 公开(公告)日: | 2019-02-19 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李佳 |
地址: | 201306 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 暂存存储器 网络运算 网络处理器 神经网络运算 存储器 运算结果 内核 异构 读取 指令 存储器连接 存储器总线 功耗开销 网络计算 并行性 总线 存储 网络 | ||
1.一种神经网络处理器,包括:存储器、高速暂存存储器和异构内核;其中,
所述存储器,用于存储神经网络运算的数据和指令;
所述高速暂存存储器,通过存储器总线与所述存储器连接;
所述异构内核,通过高速暂存存储器总线与所述高速暂存存储器连接,通过高速暂存存储器读取神经网络运算的数据和指令,完成神经网络运算,并将运算结果送回到高速暂存存储器,控制高速暂存存储器将运算结果写回到存储器。
2.根据权利要求1所述的神经网络处理器,其中,所述异构内核包括:
多个运算内核,其具有至少两种不同类型的运算内核,用于执行神经网络运算或神经网络层运算;以及
一个或多个逻辑控制内核,用于根据神经网络运算的数据,决定执行神经网络运算或神经网络层运算的运算内核类型。
3.根据权利要求2所述的神经网络处理器,其中,所述多个运算内核包括x个通用内核和y个专用内核;其中,所述专用内核专用于执行指定神经网络/神经网络层运算,所述通用内核用于执行任意神经网络/神经网络层运算;
所述逻辑控制内核,用于根据神经网络运算的数据,决定由所述专用内核和/或所述通用内核执行神经网络运算或神经网络层运算。
4.根据权利要求3所述的神经网络处理器,其中,所述通用内核为cpu,所述专用内核为npu。
5.根据权利要求1所述的神经网络处理器,其中,所述高速暂存存储器包括共享高速暂存存储器和/或非共享高速暂存存储器;其中,一所述共享高速暂存存储器通过高速暂存存储器总线与所述异构内核中的至少两个内核对应连接;一所述非共享高速暂存存储器通过高速暂存存储器总线与所述异构内核中的一内核对应连接。
6.根据权利要求3所述的神经网络处理器,其中,所述逻辑控制内核通过高速暂存存储器总线与所述高速暂存存储器连接,通过高速暂存存储器读取神经网络运算的数据,并根据神经网络运算的数据中的神经网络模型的类型和参数,决定由专用内核和/或通用内核作为目标内核来执行神经网络运算和/或神经网络层运算。
7.根据权利要求6所述的神经网络处理器,其中,所述逻辑控制内核通过控制总线直接向所述目标内核发送信号或者经所述高速暂存存储器存储器向所述目标内核发送信号,从而控制目标内核执行神经网络运算和/或神经网络层运算。
8.根据权利要求2所述的神经网络处理器,其中,所述逻辑控制内核用于从高速缓存中读入神经网络运算的数据和指令,根据数据中的神经网络模型的类型和参数,判断是否存在支持该神经网络运算且能完成该神经网络运算规模的专用内核,若存在,则由专用内核完成该神经网络运算,否则由通用内核完成该神经网络运算。
9.根据权利要求8所述的神经网络处理器,其中,所述神经网络处理器设置有专用/通用内核信息表,该专用/通用内核信息表包含有内核的类型、编号、地址、及空闲状态信息,用于判断是否存在支持该神经网络运算且能完成该神经网络运算规模的专用内核。
10.根据权利要求9所述的神经网络处理器,其中,所述逻辑控制内核包括译码器,该译码器用于判断所述指令的类型,及根据所述指令判断网络层的类型。
11.根据权利要求9所述的神经网络处理器,其中,所述逻辑控制内核包括内容寻址存储器,用于根据网络层编号及规模决定使用的内核的类型和编号。
12.根据权利要求9所述的神经网络处理器,其中,所述专用内核和通用内核统一编号或独立编号,若一专用内核的编号m与一通用内核的编号n相同,则根据物理地址来寻址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811423421.X/1.html,转载请声明来源钻瓜专利网。