[发明专利]支持多线程的数据搬运装置及处理器在审
申请号: | 202210336167.X | 申请日: | 2022-03-31 |
公开(公告)号: | CN114661353A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 谢耀;李智 | 申请(专利权)人: | 成都登临科技有限公司;上海登临科技有限公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38;G06F9/50;G06F13/28;G06F15/78;G06N3/04;G06N3/063 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;苏晓丽 |
地址: | 610094 四川省成都市武侯*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 支持 多线程 数据 搬运 装置 处理器 | ||
本申请提供了支持多线程的数据搬运装置,其包括控制模块、指令缓存、上下文缓存以及由读入DMA模块、数据缓存模块和输出DMA模块构成的以流水线方式运行的数据通路。该数据通路中每个模块在处理完一个指令后将相关指令信息和数据一起传递至流水线中的下一个模块,接着开始处理下一个指令;与指令相关的上下文信息保存在上下文缓存中由各模块共享。该数据搬运装置在尽量减少面积开销的前提下提高了多线程场景中数据搬移的效率。
技术领域
本申请涉及并行计算处理器,尤其涉及适用于多核心并行计算中的数据搬运的装置及处理器。
背景技术
本部分的陈述仅仅是为了提供与本申请的技术方案有关的背景信息,以帮助理解,其对于本申请的技术方案而言并不一定构成现有技术。
人工智能(AI)技术在近些年来得到了迅猛的发展,已经渗透至视觉感知、语音识别、辅助驾驶、智能家居、交通调度等各个领域。很多AI算法都涉及到基于神经网络的学习和计算,例如卷积神经网络CNN、循环神经网络RNN、深度神经网络DNN等等。这些AI算法要求较强的并行计算能力以处理海量数据,因此通常采用诸如GPU、GPGPU、AI加速器之类的能支持多核心并行计算的处理器来执行多层神经网络运算。这些处理器中通常采用单指令多线程(SIMT,Single Instruction Multiple Threads)架构,多个线程的任务可以同时运行在处理器的不同计算核心(core)上,当一组线程因为访存或其他原因出现等待时,就将其挂起,转而执行另一组线程,处理器的控制单元可以在多组线程之间快速切换,以此来尽量最大化处理器的吞吐量。然而,数据的存取速度始终是影响处理器运算效率的重要因素。如何在片上缓存和片外存储器之间高效率地进行大量的数据搬运是并行计算处理器中亟需解决的问题。
需要说明的是,上述内容仅用于帮助理解本申请的技术方案,并不作为评价本申请的现有技术的依据。
发明内容
发明人在实践中发现虽然可以通过在芯片内部设置片上高速缓存来预取部分数据和缓存计算结果的方式来改善数据的存取速度,但由于诸如成本、体积等方面的限制,片上缓存的容量通常是有限的。尤其是在涉及神经网络的应用中,这样有限的片上缓存往往无法缓存与神经网络的多个层相关的所有数据。另外,发明人也尝试了采用直接存储器访问(Direct Memory Access,DMA)来进行片上缓存和片外存储器之间数据搬运,但发现由于每次启用DMA都需要各个计算核心来分别启动和配置DMA传输,这大大降低了多核心上大数量的多线程任务的执行效率。虽然可以尝试通过流水线架构的DMA来提高指令之间并行性,但在用来执行诸如神经网络之类的AI算法的SIMT处理器中,除了指令之外,往往还需要额外的上下文来描述待处理的数据(例如神经网络各个层的输入和输出的数据排列、数据类型、特征图大小等等),如果将这些上下文连同指令一起沿流水线传播,必然会产生很大的面积消耗。
因此,本申请实施例提供了一种支持多线程的数据搬运装置,在尽量减少面积开销的前提下提高多线程场景下的数据搬移效率,尤其适用于SIMT处理器中的数据搬移。
上述目的是通过以下技术方案实现的:
根据本申请实施例的第一方面,提供了一种支持多线程的数据搬运装置,包括控制模块、指令缓存、上下文缓存以及以流水线方式运行的数据通路。所述数据通路至少包括读入DMA模块、数据缓存模块和输出DMA模块。其中所述指令缓存和所述上下文缓存可以由所述数据通路中各模块所共享,以及其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都登临科技有限公司;上海登临科技有限公司,未经成都登临科技有限公司;上海登临科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210336167.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种虚拟道路配置模块
- 下一篇:一种轮替式滴灌带挤出过滤系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置