[发明专利]一种多核处理器高速缓存及其管理方法有效
申请号: | 201110227588.0 | 申请日: | 2011-08-09 |
公开(公告)号: | CN102270180A | 公开(公告)日: | 2011-12-07 |
发明(设计)人: | 汪东升;李国红;刘振宇 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F12/08 | 分类号: | G06F12/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多核 处理器 高速缓存 及其 管理 方法 | ||
技术领域
本发明涉及计算机系统结构技术领域,特别涉及一种多核处理器高速缓存及其管理方法。
背景技术
传统的单核处理器通过提高运行频率来提高计算性能,然而,单纯增加晶体管数目不仅耗用大量晶体管资源,而且随着时钟频率不断攀升,微处理器的功耗也迅速增加。提高芯片性能和减少能耗成为矛盾,单核处理器的性能提升已遇到瓶颈。为解决这一问题,多核处理器的设计思想应运而生。通过在单个芯片上集成多个高效内核,就可以在保持工作频率的条件下实现性能的提升,以获得更高的能效。
在多核处理器中,分片式片上多核处理器是一种较为通用的结构,在多核处理器的体系结构研究中被广泛采用。其中,每个节点(分片)由处理器核(包含一级高速缓存)、二级高速缓存和片上网络路由器等模块构成,各节点间通过片上2D mesh网络连接,构成一个分片式多核处理器(Tiled Multicore Processors)。分片式多核处理器可以使设计人员集中在单片(Tile)的设计上,随后将单片的设计复制到整个芯片,简化了设计和制造过程。这样的结构具有很好的扩展性,可以应用在大规模的多核处理器中。
根据摩尔定律,计算机处理器的性能每18至24个月增加一倍,然而,内存的访问速度仅以每年7%-10%的速度增长,远远落后于处理器的增长速度。相对于处理器来说,内存访问延迟以每十年5倍的速度增长,处理器与存储器的差距不断增加,造成了系统结构的失衡,形成了阻碍性能提升的“存储墙”,多核处理器中数据处理速度和存储器访问速度之间的不匹配会导致多核处理器资源利用的不平衡,阻碍多核处理器系统吞吐率的提高,从而使得对存储系统的访问成为整个计算机系统的性能瓶颈。
为解决“存储墙”问题,进一步提高多核处理器的性能,片上高速缓存的管理成为多核处理器研究中的一个重要问题。高速缓存管理技术的目的是降低访问延迟和减少片外访问次数。在高速缓存管理技术中,有两种主要的方法:一种是改变高速缓存的组织方式,采用私有高速缓存和共享高速缓存混合的组织结构,这种方法扩展性差,无法应用在大规模多核处理器中;另一种是通过复制和迁移技术,在共享二级高速缓存结构的基础上,减少远程高速缓存访问,降低访问延迟,或者在私有二级高速缓存结构的基础上,增加片上高速缓存的有效容量,降低片外存储器访问延迟。这些方法的共同点是对二级高速缓存的复制和迁移,由此造成了在二级高速缓存中查找时的高延迟,结构复杂,扩展性差,减少了二级高速缓存的有效容量,增加了面积和功耗,有的方法还需要修改操作系统。
发明内容
(一)要解决的技术问题
针对现有技术的缺点,本发明为了解决现有技术中片上高速缓存管理时在二级高速缓存中查找效率低的问题,提出了一种多核处理器高速缓存及其管理方法,通过对多核处理器的核进行分组,在每个分组中增加组标签部件,实现了组内一级高速缓存的共享,减少了对二级高速缓存的访问次数,提高了多核处理器的整体性能。
(二)技术方案
为实现上述目的,本发明采用如下技术方案:
一种多核处理器高速缓存,所述多核处理器包括至少四个节点,所述多核处理器高速缓存中:
一级高速缓存为每个处理器核私有,二级高速缓存为所有处理器核分布式共享,每个节点由包含一级高速缓存的处理器核、二级高速缓存和片上网络路由器构成,各节点间通过所述片上网络路由器连接形成2D mesh网络;
其中,每相邻的四个节点构成一个分组,每个分组设置有一个组标签单元,所述组标签单元中复制了相应分组中四个处理器核的一级高速缓存的标签和状态,用于在组内实现一级高速缓存数据的共享。
优选地,所述组标签单元的每一行由组内四个一级高速缓存中相应行的标签和状态部分依次组成。
优选地,在所述二级高速缓存中以行为单位维护高速缓存的一致性,每一行包括地址标签、数据、状态和共享目录,其中,共享目录是一个宽度为所述多核处理器中分组数目的位向量,用来标识分组对此高速缓存行的访问情况。
更进一步地,本发明还同时提供一种多核处理器高速缓存的管理方法,应用于如上所述的多核处理器高速缓存中,所述方法包括步骤:
S1,第一处理器核请求访问数据x;
S2,首先在所述第一处理器核的一级高速缓存中查找,当所述数据x在一级高速缓存中命中时,转到步骤S10进行本地读或写;当所述数据x在一级高速缓存中未命中时,所述第一处理器核访问其所在分组的组标签单元,执行步骤S3;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110227588.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高度可调的紧凑型公交车辆拉手
- 下一篇:一种电视机