[发明专利]用于实施成形的存储器访问操作的系统和方法有效
申请号: | 201210520963.5 | 申请日: | 2012-12-06 |
公开(公告)号: | CN103218208A | 公开(公告)日: | 2013-07-24 |
发明(设计)人: | 仇小钢;杰克·希莱尔·肖凯特;曼纽尔·奥利维尔·高瑟;潇耀明 | 申请(专利权)人: | 辉达公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 徐丁峰;魏宁 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 实施 成形 存储器 访问 操作 系统 方法 | ||
技术领域
本发明总体上涉及计算机架构,并且更具体地,涉及用于寄存器堆中的操作数收集的系统和方法。
背景技术
并行处理系统中的普遍做法是,设计同时执行多个线程的处理器。当这样的线程都执行相同指令序列时(通常对于每个线程有不同的数据),具有在线程中间共享某些资源的实际益处。例如,每个线程均可以执行访问一个或多个操作数的指令,所述一个或多个操作数将检索自共享的寄存器堆的库(bank)中,其中每个线程均访问寄存器堆的库内的不同的寄存器地址。可以在单指令多线程(SIMT)和单指令多数据(SIMD)处理器上发现该类型的操作。
在操作期间,处理器可以跨多个线程来执行指令,其中指令从寄存器堆的库来访问一个或多个操作数,并且操作数位于寄存器堆的库内的不同的寄存器地址处。随后,处理器实施寄存器访问操作以检索操作数。例如,如果四个线程同时执行每线程要求三个操作数的指令,那么为了执行该指令,处理器检索多达十二个单独的操作数。当可以在同一个寄存器访问操作中检索全部十二个操作数的时候,性能得到极大的改善。
由于诸如物理存储器配置等各种限制,因此可能不可同时访问寄存器的某些库合。当两个或更多个操作数位于不可同时被访问的寄存器堆位置中时,处理器遇到寄存器库冲突。在这样的情况下,处理器不能在单个寄存器访问操作中检索全部操作数。
避免寄存器堆冲突的方法之一是,对由当前指令所访问的每个操作数均串行地实施单独的寄存器访问操作。因为对每个操作数均是每次访问一个,所以该方法避免了寄存器库冲突。然而,该方法的一个缺点在于,处理器不能使用同一个寄存器访问操作来检索多个操作数,以访问不会造成寄存器库冲突的操作数。例如,如果四个线程正执行要求三个操作数的指令,那么为了避免寄存器库冲突,处理器将实施十二个单独的寄存器访问操作。然而,操作数的分布遍及寄存器堆的库,有可能使得处理器可以在少于十二个寄存器访问操作中检索全部操作数。在这样的情形下,没有实现与存储器访问操作相关联的潜在的效率。
如前述所例示的,本领域中所需要的是从寄存器堆中收集操作数的更有效的方式。
发明内容
本发明的一个实施例阐述了用于实施寄存器的存储器操作的计算机实现的方法。指令分派单元接收将跨多个操作数执行的指令。所述指令分派单元确认其中存储所述多个操作数的多个寄存器堆经由特定存储器访问模式可访问。接着,所述指令分派单元形成与所述特定存储器访问模式相对应的成形的存储器访问操作。随后,所述指令分派单元实施所述成形的存储器访问操作以从所述多个寄存器堆来访问所述多个操作数。
本公开技术的一个优点在于,在单个寄存器访问操作中从寄存器堆检索多个操作数,而不存在资源冲突。
附图说明
为了详细地理解本发明的上述特征,对于以上简要说明的发明,可以参照实施例进行更为具体的描述,其中一些实施例示出于附图中。然而,应注意的是,附图中示出的只是本发明的代表性实施例,因此不应被认为是对本发明的范围的限制,本发明可以适用于其他同等有效的实施例。
图1是示出了配置为实施本发明的一个或多个方面的计算机系统的框图;
图2是根据本发明一个实施例的、用于图1的计算机系统的并行处理子系统的框图;
图3A是根据本发明的一个实施例的、图2的前端的框图;
图3B是根据本发明一个实施例的、图2的一个并行处理单元内的一般处理集群的框图;
图3C是根据本发明的一个实施例的、图3B的流多处理器的部分的框图;
图4A示出了根据本发明的一个实施例的、配置用于操作数收集的寄存器堆的库;
图4B示出了根据本发明的替代实施例的、配置用于操作数收集的寄存器堆的库;
图4C示出了根据本发明的另一个替代实施例的、配置用于操作数收集的寄存器堆的库;
图4D示出了根据本发明的又一个替代实施例的、配置用于操作数收集的寄存器堆的库;
图5示出了根据本发明的一个实施例的、图3C的warp调度器程序和指令单元以及本地寄存器堆的框图;以及
图6是根据本发明的一个实施例的、用于收集寄存器堆操作数的方法步骤的流程图。
具体实施方式
在下面的描述中,阐释了大量具体细节以提供对本发明更为彻底的理解。然而,对于本领域技术人员来讲将显而易见的是,在缺少这些具体细节中的一个或多个的情况下也可以实施本发明。
系统概述
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210520963.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:6-氟-3-羟基-2-吡嗪甲酰胺的钠盐
- 下一篇:抗崩解的弹性体组合物