[发明专利]用于多客户端的可配置高速缓存有效
申请号: | 201080053459.8 | 申请日: | 2010-09-24 |
公开(公告)号: | CN102640127A | 公开(公告)日: | 2012-08-15 |
发明(设计)人: | 亚历山大·L·明金;史蒂文·詹姆斯·海因里希;拉杰什瓦拉恩·赛尔瓦内桑;布雷特·W·库恩;查理斯·麦卡弗;安佳娜·拉金德拉恩;斯图尔特·G·卡尔顿 | 申请(专利权)人: | 辉达公司 |
主分类号: | G06F13/00 | 分类号: | G06F13/00 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 顾珊;魏宁 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 客户端 配置 高速缓存 | ||
相关申请的交叉引用
本申请要求于2009年9月25日提交的序列号为12/567,445的美国专利申请的优先权。
技术领域
本发明总体上涉及数据存储,且更具体地涉及一种存储资源,所述存储器资源可配置为提供高速缓存(cache)功能以访问第一部分数据,并且提供寄存器功能以访问另一部分数据。
背景技术
数据处理系统中对性能的要求不断提高。多个处理单元可以被配置为通过执行多个并行线程而并行操作。对于一些应用软件而言,多个并行线程独立地执行。对于另一些应用软件而言,多个并行线程共享一些数据。例如,第一线程可计算由一个或多个其他线程使用的输入。最后,线程可以被组织成群组,其中数据在每个群组内而非在群组之间共享。
使用诸如由提供的CUDATM C(通用并行计算架构)和PTXTM(低级并行线程执行虚拟机和虚拟指令集架构)这类编程模块写入的多线程并行程序来访问两个或更多各异的存储器地址空间,这些存储器地址空间均具有不同的并行作用域(scope),例如,每线程的私有本地存储器、每群组的共享存储器和每应用的全局存储器。私有本地存储器被实现为专用本地存储,主要只可通过单线程访问,并且每群组共享存储器可以被实现为SRAM存储器,其可由群组中的所有线程访问。全局存储器包括可高速缓存的片外(off-chip)存储器。
据此,本领域中需要这样一种技术,这种技术能够减小用于提供存储器空间并使每个空间均具有不同作用域的专用存储。
发明内容
本发明的一个实施例提出了一种用于提供L1高速缓存的技术,所述L1高速缓存为中央存储资源。L1高速缓存服务于具有多样化的延时和带宽要求的多个客户端,并且可以被重新配置以创建实现L1高速缓存的多个存储空间。在L1高速缓存内配置的“直接映射”存储区可以代替专用缓冲区(buffer)、FIFO和接口路径,允许L1高速缓存的客户端交换属性和基元数据。直接映射存储区可以被用作全局寄存器堆(register file)。在L1高速缓存内配置的“本地-全局高速缓存”存储区可以被用于支持对于多个空间的加载/存储存储器请求。这些空间包括全局、本地和调用-返回堆栈(CRS)存储器。一个优点在于L1高速缓存可以代替先前的架构中的专用缓冲区、高速缓存和FIFO。
本发明的用于在一级(L1)高速缓存内分配单独的存储器空间的方法,其各种实施例包括:在静态随机访问存储器(SRAM)存储资源中配置第一组条目,以用作本地-全局数据高速缓存;在SRAM存储资源中配置第二组条目,以用作直接映射寄存器;以及对由L1高速缓存从第一客户端和第二客户端接收的存储器访问请求进行仲裁,所述第一客户端被配置为产生向所述第二组条目存储数据的访问请求,所述第二客户端被配置为产生从所述第二组条目加载数据、向所述第一组条目存储数据以及从所述第一组条目加载数据的访问请求。
本发明的各种实施例包括处理器,所述处理器通过下列配置以在一级(L1)高速缓存内分配单独的存储器空间:在静态随机访问存储器(SRAM)存储资源中配置第一组条目,以用作本地-全局数据高速缓存;在SRAM存储资源中配置第二组条目,以用作直接映射寄存器;以及对由L1高速缓存从第一客户端和第二客户端接收的存储器访问请求进行仲裁,所述第一客户端被配置为产生向所述第二组条目存储数据的访问请求,所述第二客户端被配置为产生从所述第二组条目加载数据、向所述第一组条目加载数据以及从所述第一组条目加载数据的访问请求。
附图说明
为了详细地理解本发明的上述特征,对于以上简要说明的发明,可以参照实施例进行更为具体的描述,其中一些实施例示出于附图中。然而,应注意的是,附图中示出的只是本发明的代表性实施例,因此不应被认为是对本发明的范围的限制,本发明可以适用于其他同等有效的实施例。
图1是示出了被配置为实施本发明的一个或多个方面的计算机系统的框图;
图2是根据本发明一个实施例的、用于图1的计算机系统的并行处理子系统的框图;
图3A是根据本发明一个实施例的、图2的一个PPU内的GPC的框图;
图3B是根据本发明一个实施例的、图3A的L1高速缓存的一部分的框图;
图4是根据本发明一个实施例的、用作数据高速缓存和直接映射存储器的SRAM的配置的概念图;
图5是根据本发明一个实施例的、用于配置L1高速缓存的方法步骤的流程图;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080053459.8/2.html,转载请声明来源钻瓜专利网。