[发明专利]具有高带宽和低功率向量寄存器堆的流处理器有效
申请号: | 201710434300.4 | 申请日: | 2017-06-09 |
公开(公告)号: | CN109032668B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 陈佳升;何斌;马克·M·莱瑟;迈克尔·J·曼托尔;邹云晓 | 申请(专利权)人: | 超威半导体公司 |
主分类号: | G06F9/302 | 分类号: | G06F9/302;G06F9/38;G06F15/80 |
代理公司: | 上海胜康律师事务所 31263 | 代理人: | 樊英如;邱晓敏 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 宽和 功率 向量 寄存器 处理器 | ||
本发明涉及一种具有高带宽和低功率向量寄存器堆的流处理器。公开了用于实现由并行处理器使用的高带宽低功率的向量寄存器堆的系统、装置和方法。在一个实施方式中,系统至少包括具有多个处理流水线的并行处理单元。并行处理单元包括向量运算逻辑单元和高带宽低功率向量寄存器堆。向量寄存器堆包括满足寄存器带宽要求的多内存库高密度随机存取存储器(RAM)。并行处理单元还包括指令请求队列和指令操作数缓冲器,以便为VALU指令和向量I/O指令提供足够的本地带宽。此外,并行处理单元被配置为利用RAM的输出触发器作为最后一级高速缓存来减少多个指令之间的重复操作数请求。并行处理单元包括向量目标高速缓存以向向量寄存器堆提供附加的R/W带宽。
技术领域
本发明涉及计算机领域,更具体地涉及具有高带宽和低功率向量寄存器堆的流处理器。
背景技术
许多不同类型的计算系统包括向量处理器或单指令多数据(SIMD)处理器。任务可以在这些类型的处理器上并行执行,以增加计算系统的吞吐量。这些任务的一些指令可以利用大部分共享资源,这会降低处理器的性能。因此,共享资源的争用可能导致以低效的方式执行并行任务。另外,用于在并行任务之间共享资源的传统方案可导致功耗的增加。
并行处理器通常是流水线式的。理想情况下,每个时钟周期都会对流水线的每个阶段的指令进行有用的执行。为了利用每个时钟周期,需要为处理流水线提供针对各种指令的处于其各个执行阶段的数据。然而,流水线之间的资源共享可能导致这些资源的争用,并且导致流水线的部分空闲且不执行有用的工作。这降低了处理流水线的效率。例如,当访问寄存器堆随机存取存储器(RAM)的任何两个指令冲突时,流水线将在冲突解决时停止。
发明内容
本文公开了用于实现由流处理器使用的高带宽低功率向量寄存器堆的系统、装置和方法。本公开的一些方面可以具体描述如下:
1.一种系统,其包括:
存储器;和
耦合到所述存储器的处理器,其中所述处理器包括:
向量寄存器堆;
源操作数缓冲器;
向量算术逻辑单元(VALU);和
用于存储由所述VALU执行的指令的结果的向量目标高速缓存;
其中所述处理器被配置为:
从所述向量目标高速缓存逐出第一高速缓存线;以及
响应于确定所述第一高速缓存线包括由待决指令针对的一个或多个源操作数,将所述第一高速缓存线写到所述源操作数缓冲器。
2.如条款1所述的系统,其中所述处理器还被配置为:
识别第一指令的一个或多个源操作数;
确定是否将所述一个或多个源操作数从所述向量寄存器堆、源操作数缓冲器或向量目标高速缓存转发到所述VALU;
等待直到所述VALU的最后一个流水线阶段在所述向量目标高速缓存中分配高速缓存线;以及
将所述第一指令的结果存储在所述向量目标高速缓存中分配的所述高速缓存线中。
3.如条款2所述的系统,其中所述处理器被配置为:
响应于确定所述一个或多个源操作数存储在所述源操作数缓冲器中,从所述源操作数缓冲器转发所述一个或多个源操作数;
响应于确定所述一个或多个源操作数存储在所述向量寄存器堆中,从所述向量寄存器堆中预取所述一个或多个源操作数并将所述一个或多个源操作数存储在所述源操作数缓冲器中;以及
响应于向所述VALU发出第一指令,将所述一个或多个源操作数从所述源操作数缓冲器传送到所述VALU。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超威半导体公司,未经超威半导体公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710434300.4/2.html,转载请声明来源钻瓜专利网。