[发明专利]一种面向粗粒度可重构阵列的可配置便笺式缓存设计方法在审
申请号: | 202111361693.3 | 申请日: | 2021-11-17 |
公开(公告)号: | CN114064560A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 景乃锋;霍洋洋;胡令矿;张子涵;蒋剑飞;王琴;毛志刚 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F15/78 | 分类号: | G06F15/78 |
代理公司: | 上海旭诚知识产权代理有限公司 31220 | 代理人: | 郑立 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 粒度 可重构 阵列 配置 便笺 缓存 设计 方法 | ||
本发明公开了一种面向粗粒度可重构阵列的可配置便笺式缓存设计方法,涉及可重构阵列的片上缓存领域,所述方法包括:按数据流和数据流组的方式组织所需要的数据,构建所述数据流和所述数据流组的参数配置;通过计数循环结束标志获取应用执行状态,设置所述数据流组状态切换指令和有限状态机,同步控制缓存中的所述数据流和数据执行相应操作。本发明可以解决Cache中存在的问题,具有易于使用、可预取、可编程的自动图像边界处理、可消除访存冲突、减少延迟等特征,利用可编程的访存模式,最大化片上数据复用,同时支持访存和计算的解耦合,提高阵列的计算效率。
技术领域
本发明涉及可重构阵列的片上缓存领域,尤其涉及一种面向粗粒度可重构阵列的可配置便笺式缓存设计方法。
背景技术
可重构阵列处理器是一种具备优秀的自定义配置能力的新型处理器,可以承担数据密集型运算,也能够相较FPGA(Field Programmable Gate Array)获得更好的工作频率,实现高性能运算。作为一种灵活性与专用性的折中方案[1],可重构阵列处理器既可以保持相对于专用集成电路(ASIC)的较高性能,又可以实现类似FPGA一样的高自由度[2]。数据流驱动的可重构阵列每一次运行前首先接收配置信息,配置控制模块将配置信息送入每一个执行单元和每一个互连资源上,应用程序正式启动之后,每个执行单元按照配置好的流程进行运算。
粗粒度可重构阵列(Coarse-grained reconfigurable array,CGRA)指的是阵列中基本计算单元的数据处理宽度是比较大的位宽,例如32比特,这是相对于FPGA的单比特的细粒度而言的。粗粒度可重构处理器能够处理各种计算密集型的应用算法,但是由于存储墙问题的广泛性[3]以及静态CGRA的算力规模,访存性能对CGRA的性能至关重要。在静态CGRA中,尽管能够通过丰富的互连资源实现更多的处理单元(Processing Element,PE)间数据复用,但大量的PE单元在运行中的每个周期仍然需要片上存储系统提供多个新数据,以满足数据流计算的需要。
在通用处理器领域,往往使用高速缓存(Cache)作为片上存储组织方式。Cache的软件透明性使它易于编程,但Cache有几个低效率的问题。首先,Cache使用间接的、硬件管理的寻址,Cache在加载和存储数据时指定了硬件必须转换的地址,并确定其在片上内存中的物理位置。在这种方式下,从性能方面来说,如果同时需要的数据被映射到相同的位置上,则数据会被反复替换、重新载入,即产生冲突缺失问题;从功耗方面来说,每次访问Cache,无论是否命中,都会产生标记(Tag)比较的开销,以及在电路面积上的损耗。此外,Cache从动态随机存储器(Dynamic Random Access Memory,DRAM)中载入(load)数据是被动的,即产生强制缺失问题,发生访存缺失(miss)后才会向发出load请求,这导致计算与DRAM访存操作一定程度上是耦合的,严重堵塞了数据流,阻碍了阵列计算。
同样,因为应用访存特点引入的请求冲突是影响存储性能的另一大重要因素,片上缓存在物理上被分为多组(Multi-Bank),在同一时钟周期不能访问存储在同一Bank但地址不同的数据。若同一Bank的两个或多个数据在同一周期被请求,则会发生Bank冲突(BankConflict),此时数据无法在同一时钟周期返回,导致数据流阻塞,严重降低性能。
由于CGRA主要面向如神经网络等计算密集型任务,其输入输出数据一般为图像或张量格式,这意味着任务中往往包含大量线性地址计算,使用包含浮点计算单元的PE执行定点数计算是对算力的一种极大浪费,该问题也可以使用片上访存系统辅助解决。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111361693.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建立连接的方法、装置、终端及存储介质
- 下一篇:一种流体力学综合实验装置