[发明专利]共享本地存储器读取合并和多播返回在审
申请号: | 202010222550.3 | 申请日: | 2020-03-26 |
公开(公告)号: | CN112130752A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | J.雷;S.梅于兰;V.乔治;V.K.彦谢利安 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06;G06T1/20 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李啸;姜冰 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 共享 本地 存储器 读取 合并 返回 | ||
1.一种通用图形处理器,包括:
第一组计算单元;
第二组计算单元;以及
存储器,所述存储器与所述第一组计算单元和所述第二组计算单元耦合,其中所述存储器要将对所述存储器的地址块的第一读取请求与对所述存储器的所述地址块的第二读取请求合并,以减少对与所述地址块相关联的存储器库的存储器访问的数量。
2.根据权利要求1所述的通用图形处理器,其中所述存储器包括记分板,以存储用于所述第一读取请求的第一条目以及用于所述第二读取请求的第二条目,并且所述存储器要在确定所述第一条目和所述第二条目具有匹配的地址块时将所述第一读取请求与所述第二读取请求合并。
3.如权利要求2所述的通用图形处理器,其中用于所述第一读取请求的所述第一条目和用于所述第二读取请求的所述第二条目要存储与相应读取请求相关联的计算单元或线程的标识符。
4.如权利要求3所述的通用图形处理器,其中所述第一读取请求与所述第一组计算单元的第一线程相关联,并且所述第二读取请求与所述第一组计算单元的第二线程相关联。
5.如权利要求3所述的通用图形处理器,其中所述第一读取请求与所述第一组计算单元的第一线程相关联,并且所述第二读取请求与所述第二组计算单元的第二线程相关联。
6.如权利要求1-5中的任一项所述的通用图形处理器,还包括与所述第一组计算单元和所述第二组计算单元耦合的存储器仲裁器,其中所述存储器经由所述存储器仲裁器与所述第一组计算单元和所述第二组计算单元耦合。
7.如权利要求6所述的通用图形处理器,其中所述存储器仲裁器包括线程分派缓冲器和线程分派总线,以将供执行的线程分派给所述第一组计算单元和所述第二组计算单元。
8.如权利要求6所述的通用图形处理器,其中所述存储器仲裁器要多播所述第一读取请求和所述第二读取请求的读取结果。
9.如权利要求8所述的通用图形处理器,其中所述存储器要向所述存储器仲裁器发送位掩码和读取返回消息,所述读取返回消息包括所述第一读取请求和所述第二读取请求的所述读取结果,并且所述位掩码指示与所述读取返回消息相关联的计算单元或线程。
10.如权利要求9所述的通用图形处理器,其中所述存储器仲裁器要基于所述位掩码多播所述第一读取请求和所述第二读取请求的所述读取结果。
11.如权利要求10所述的通用图形处理器,其中所述存储器仲裁器包括一个或多个缓冲器,以在所述计算单元接收多播数据之前存储所述多播数据,其中将数据保持在所述一个或多个缓冲器中,直到与多播相关联的每个计算单元接收到所述多播数据。
12.一种方法,包括:
在存储器处接收第一读取请求,所述存储器在通用图形处理器的第一组计算单元和第二组计算单元之间共享;
在所述第一读取请求未决的同时在所述存储器处接收第二读取请求;
确定与所述第一读取请求相关联的地址块和与所述第二读取请求相关联的地址块匹配;以及
将所述第二读取请求与所述第一读取请求合并。
13.如权利要求12所述的方法,其中,将所述第二读取请求与所述第一读取请求合并包括:针对所述第一读取请求和所述第二读取请求执行一次对所述存储器的一个或多个存储器库的访问。
14.如权利要求13所述的方法,还包括:确定与所述第一读取请求相关联的地址块不同于与所述第二读取请求相关联的地址块,并且针对所述第一读取请求和所述第二读取请求执行对所述一个或多个存储器库的分开的访问。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010222550.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种工控主机的合规评分方法、装置
- 下一篇:促进基于硬件的表查找的技术