[发明专利]原子操作的智能线程分派和向量化在审
申请号: | 201810392607.7 | 申请日: | 2018-04-27 |
公开(公告)号: | CN108804205A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 陈峰;N.斯里尼瓦萨;A.R.阿普;A.科克;K.辛哈;B.温布;J.雷;N.C.G.冯博里斯;P.瑟蒂;B.J.阿什鲍格;S.雅哈吉达尔;V.兰加纳坦 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/46 | 分类号: | G06F9/46;G06F9/38;G06F15/167;G06F15/17;G06T1/20;G06T1/60;G06N3/04;G06N3/08 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 毕铮;杨美灵 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分派 向量化 集合 原子操作 智能线 线程 第一线 图形处理器 工作负荷 物理上将 相邻表面 计算块 群集 关联 智能 检测 | ||
1.一种用于自主机器处的智能分派和向量化的装置,所述装置包括:
检测/观察逻辑,用于检测对应于与涉及图形处理器的任务相关联的多个工作负荷的多个线程;以及
智能线程分派逻辑,用于确定所述多个线程中与彼此相似或具有相邻表面的第一线程集合,其中所述智能线程分派逻辑还通过使用第一相邻计算块集合而在物理上将所述第一线程集合紧密地群集在一起。
2.根据权利要求1所述的装置,其中所述智能线程分派逻辑还确定所述多个线程中与彼此分开或不相似的第二线程集合,其中所述第二线程集合在第二计算块集合上被启动以避免与所述第一计算块集合的地址冲突。
3.根据权利要求2所述的装置,其中所述第一和第二计算块集合由包含高速缓存的共享资源所支持以保持存储器空间或像素空间中的局部性以提供针对公共区域的利用。
4.根据权利要求1所述的装置,还包括预取逻辑,用于在所述多个线程中的一个或多个被加载到着色器核中的时候同时将数据预取到一个或多个高速缓存中。
5.根据权利要求1所述的装置,还包括向量化逻辑,用于促进向量化的锁定操作使得对多个操作数同时进行以下中的一个或多个:锁定、修改和写回。
6.根据权利要求5所述的装置,其中所述向量化逻辑还从数据流中读取操作数宽度和向量长度,其中所述向量化逻辑还设置或清除锁定位以基于所述操作数宽度和所述向量长度来在所述数据流的向量数据上执行操作。
7.根据权利要求1所述的装置,其中所述图形处理器与应用处理器协同定位在公共半导体封装上。
8.一种用于自主机器处的智能分派和向量化的方法,所述方法包括:
检测对应于与涉及图形处理器的任务相关联的多个工作负荷的多个线程;
确定所述多个线程中与彼此相似或具有相邻表面的第一线程集合;以及
通过使用第一相邻计算块集合而在物理上将所述第一线程集合紧密群集在一起。
9.根据权利要求8所述的方法,还包括确定所述多个线程中与彼此分开或不相似的第二线程集合,其中所述第二线程集合在第二计算块集合上被启动以避免与所述第一计算块集合的地址冲突。
10.根据权利要求9所述的方法,其中所述第一和第二计算块集合由包含高速缓存的共享资源所支持以保持存储器空间或像素空间中的局部性以提供针对公共区域的利用。
11.根据权利要求8所述的方法,还包括在所述多个线程中的一个或多个被加载到着色器核中的时候同时将数据预取到一个或多个高速缓存中。
12.根据权利要求8所述的方法,还包括促进向量化的锁定操作使得对多个操作数同时进行以下中的一个或多个:锁定、修改和写回。
13.根据权利要求12所述的方法,还包括:
从数据流中读取操作数宽度和向量长度;以及
设置或清除锁定位以基于所述操作数宽度和所述向量长度来在所述数据流的向量数据上执行操作。
14.根据权利要求8所述的方法,其中所述图形处理器与应用处理器协同定位在公共半导体封装上。
15.至少一个包括多个指令的机器可读介质,所述多个指令当在计算设备上被执行时实现或执行如在权利要求8-14的任一项中要求保护的方法。
16.一种系统,包括用以实现或执行如在权利要求或示例8-14的任一项中要求保护的方法的机构。
17.一种装置,包括用于执行如在权利要求或示例8-14的任一项中要求保护的方法的部件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810392607.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多线程并行构造后缀数组的方法及系统
- 下一篇:同步任务的处理方法及系统