[发明专利]GPU读写单元通过操作数收集器访问寄存器文件的方法有效
申请号: | 202110044102.3 | 申请日: | 2021-01-13 |
公开(公告)号: | CN112817639B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 李炳超;李浒;刘宝煜;刘著萌;廖于一;刘丁铭 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F12/0875 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | gpu 读写 单元 通过 作数 收集 访问 寄存器 文件 方法 | ||
1.一种GPU读写单元通过操作数收集器访问寄存器文件的方法,其特征在于,所述方法包括以下步骤:
操作数收集器访问寄存器文件获取访存指令所需操作数,当所有的操作数都获取完毕后,第一解复用器的选择信号为假,获取的操作数通过第一解复用器将数据分发给读写单元中的访存请求生成器,同时操作数收集器的非空信号为假;
若发生命中并且命中数据位于L1 cache中,数据行索引信号通过第二解复用器和第五多路选择器被发送到L1 cache,将获取的数据通过第一多路选择器发送到数据缓冲器;
若发生命中并且访存数据位于寄存器文件中,数据行索引信号通过第二解复用器和第四多路选择器被发送到地址转换单元,将数据行索引转换为寄存器地址,经第五解复用器和第一控制逻辑发送到操作数收集器,操作数收集器的非空信号变为真。
2.根据权利要求1所述的一种GPU读写单元通过操作数收集器访问寄存器文件的方法,其特征在于,所述第一控制逻辑包含第二多路选择器,选择信号由操作数收集器的非空信号和访存请求队列的非空信号经或非门获得;
当操作数收集器和访存请求队列的非空信号均为假时,选择信号为真,第二多路选择器选择线程束调度器发送的操作数请求并作为输出发送到操作数收集器中。
3.根据权利要求2所述的一种GPU读写单元通过操作数收集器访问寄存器文件的方法,其特征在于,所述方法还包括:
选择信号为假时,第二多路选择器接受地址转换单元发送来的访问请求作为输出发送到操作数收集器。
4.根据权利要求1所述的一种GPU读写单元通过操作数收集器访问寄存器文件的方法,其特征在于,所述第一控制逻辑用于避免程序在运行过程中发生的死锁现象。
5.根据权利要求1所述的一种GPU读写单元通过操作数收集器访问寄存器文件的方法,其特征在于,所述操作数收集器访问寄存器文件获取访存请求所需的数据,通过第一解复用器将数据分发到第一多路选择器,第一解复用器选择信号optype和第一多路选择器的选择信号RF_HIT均为真,数据被发送到数据缓冲器中。
6.根据权利要求1所述的一种GPU读写单元通过操作数收集器访问寄存器文件的方法,其特征在于,当缺失数据从下一级存储器返回,且所替换的数据行位于L1 Cache中,RF_MISS信号为假,数据行索引通过第四解复用器发送到第五多路选择器作为其输入,最终被发送到L1 Cache,缺失数据通过第三解复用器保存到L1 cache中;
当缺失数据从下一级存储器返回,且所替换的数据行位于寄存器文件中,RF_MISS信号为真,MISS_RETURN信号为真,数据行索引通过第四解复用器和第四多路选择器发送到地址转换单元,地址转换单元的输出通过第五解复用器发送到寄存器文件;
缺失数据通过第三解复用器和第三多路选择器保存到寄存器文件中。
7.根据权利要求1所述的一种GPU读写单元通过操作数收集器访问寄存器文件的方法,其特征在于,所述方法还包括:
当访存指令所有访存请求的数据都获取完毕之后,记分板指令结束信号为真,第三多路选择器选择数据缓冲器中的数据作为输出写入到寄存器文件中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110044102.3/1.html,转载请声明来源钻瓜专利网。