[发明专利]分形计算装置、方法、集成电路及板卡有效
申请号: | 202010340444.5 | 申请日: | 2020-04-26 |
公开(公告)号: | CN111860807B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 请求不公布姓名 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/08 |
代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 李波;孙新国 |
地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 装置 方法 集成电路 板卡 | ||
本公开涉及分形计算装置、方法、集成电路及板卡,其中本公开的分形计算装置包括在集成电路装置中,该集成电路装置包括通用互联接口和其他处理装置。计算装置与其他处理装置进行交互,共同完成用户指定的计算操作。集成电路装置还可以包括存储装置,存储装置分别与计算装置和其他处理装置连接,用于计算装置和其他处理装置的数据存储。
技术领域
本公开一般地涉及神经网络领域。更具体地,本公开涉及分形计算装置、方法、集成电路及板卡。
背景技术
机器学习技术已经大量应用于新兴商业,像是图像识别、文本识别、语音识别、面部识别视频分析、广告推荐和游戏等领域。近年来,许多不同规模的专用机器学习计算装置已部署在各种的嵌入式设备、服务器和数据中心中,人们的生活早已离不开机器学习技术。
大多数的机器学习计算装置持续专注于优化性能,光是2012年到2018年间,其功效增长了逾1200倍。虽然机器学习计算装置的能效一直在快速增长,但是编程效率的发展有限,阻碍了机器学习技术的普及化。即使现有的计算装置具有很高的峰值性能,但精简的硬件控制管理和软件堆栈对于机器学习计算装置的实际性能仍然至关重要。不仅如此,现有的机器学习计算装置的异构性、并行性和分层特性也影响了编程效率。
因此,一种同构、串行的分层结构、具有相同的指令集的机器学习计算装置是迫切需要的。
发明内容
为了至少部分地解决背景技术中提到的技术问题,本公开的方案提供了一种分形计算装置、方法、集成电路及板卡。
在一个方面中,本公开揭露一种根据指令对输入数据执行神经网络计算的方法,包括:将所述指令分为多个分形指令;将所述输入数据拆分为多个分形数据,每个分形数据对应一个分形指令;提供分形可重配指令集的多个本地指令;拆解每个分形指令为有序集合,所述有序集合由所述多个本地指令至少其中之一依序排列而成;对所述分形数据执行相对应分形指令的有序集合内的本地指令以产生中间数据;以及归约所述中间数据以完成所述神经网络计算。
在另一个方面中,本公开揭露一种根据指令执行特定操作的分形计算装置,包括多个中层计算单元及叶计算单元。每个中层计算单元包括:控制器,用以分解所述指令成多个分形指令,其中每个分形指令执行所述特定操作;以及多个分形功能单元,每个分形功能单元分别发送所述多个分形指令其中之一至下一层的中层计算单元。叶计算单元包括:控制器,用以分解所述分形指令为本地指令;以及功能单元,用以执行所述本地指令。
在另一个方面中,本公开揭露一种集成电路装置,包括前述的分形计算装置。亦揭露一种板卡,包括前述的集成电路装置。
本公开是一系列能被相同指令集所驱动的同构(homogeneous)、串行(sequential)、多层(multi-layer)、层相似(layer-similar)的机器学习计算技术方案,可以实现简单控制和高效率。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,并且相同或对应的标号表示相同或对应的部分其中:
图1是示出一种分形计算装置的框架示意图;
图2是示出本公开实施例的计算装置的框图;
图3是示出本公开的分形计算装置的示意图;
图4是示出本公开另一个实施例的流水线的示例图;
图5是示出根据本公开实施例的内存组件的划分的示意图;
图6是示出本公开另一实施例的流水线的示意图;
图7是示出本公开另一实施例的内存组件的划分的示意图;
图8是示出本公开另一实施例的静态内存段的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010340444.5/2.html,转载请声明来源钻瓜专利网。