[发明专利]对共享本地存储器进行分区的机制在审
申请号: | 202011010193.0 | 申请日: | 2020-09-23 |
公开(公告)号: | CN113094298A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | J·雷;V·兰加纳坦;B·阿什博;J·瓦乐瑞奥 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F12/084 | 分类号: | G06F12/084;G06F12/0897;G06F12/1027;G06T1/20 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘文灿 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 共享 本地 存储器 进行 分区 机制 | ||
1.一种用于促进本地存储器的分区的装置,包括:
多个执行单元,用于执行多个执行线程;
存储器,其被耦合以在所述多个执行单元之间共享访问;以及
分区硬件,用于对要用作高速缓存和共享本地存储器(SLM)的所述存储器进行分区,其中,所述分区硬件基于在活动的执行单元上执行的所述多个执行线程的数量对所述存储器进行分区。
2.根据权利要求1所述的装置,其中,所述分区硬件启动所述存储器以作为所述高速缓存进行操作。
3.根据权利要求2所述的装置,其中,所述分区硬件接收线程分派,所述线程分派包括用于将所述存储器的一部分分配为SLM块的命令。
4.根据权利要求3所述的装置,其中,所述命令包括指示SLM块的大小的报头。
5.根据权利要求2所述的装置,其中,所述分区硬件获得所述SLM块。
6.根据权利要求5所述的装置,还包括分派硬件,用于分派一组所述多个执行线程以在所述SLM块上进行操作。
7.根据权利要求5所述的装置,其中,所述分派硬件停止所述线程分派,直到所述分区硬件获得所述存储器的大小部分为止。
8.根据权利要求6所述的装置,其中,所述分区硬件跟踪所述一组执行线程对所述SLM块的使用。
9.根据权利要求6所述的装置,其中,在确定所述一组执行线程不再活动时,所述分区硬件重置所述存储器以作为所述高速缓存进行操作。
10.一种用于促进对本地存储器的分区的方法,包括对要用作高速缓存和共享本地存储器(SLM)的存储器进行分区,其中,基于在活动的执行单元上执行的多个执行线程的数量来执行所述分区。
11.根据权利要求10所述的方法,其中,对所述存储器进行分区包括:
启动所述存储器以作为所述高速缓存进行操作;
接收线程分派,所述线程分派包括用于将所述存储器的一部分分配为SLM块的命令;
分配所述SLM块;以及
获得所述SLM块。
12.根据权利要求11所述的方法,其中,所述命令包括指示SLM块的大小的报头。
13.根据权利要求12所述的方法,还包括:分派一组所述多个执行线程以在所述SLM块上进行操作。
14.根据权利要求13所述的方法,还包括:跟踪所述一组执行线程对所述SLM块的使用。
15.根据权利要求13所述的方法,还包括:在确定所述一组执行线程不再活动时,将所述存储器重置以作为所述高速缓存进行操作。
16.一种图形处理单元(GPU),包括多个切片,每个切片具有多个子切片,包括:
多个执行单元,用于执行多个执行线程;
存储器,其被耦合以在所述多个执行单元之间共享访问;以及
分区硬件,用于对要用作高速缓存和共享本地存储器(SLM)的所述存储器进行分区,其中,所述分区硬件基于在活动的执行单元上执行的所述多个执行线程的数量对所述存储器进行分区。
17.根据权利要求16所述的GPU,其中,所述分区硬件启动所述存储器以作为所述高速缓存进行操作。
18.根据权利要求17所述的GPU,其中,所述分区硬件接收线程分派,所述线程分派包括用于将所述存储器的一部分分配为SLM块的命令,其中,所述命令包括指示SLM块的大小的报头。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011010193.0/1.html,转载请声明来源钻瓜专利网。