[发明专利]用于加速叶节点中的相交的标量引擎集群在审
申请号: | 201911172075.7 | 申请日: | 2019-11-26 |
公开(公告)号: | CN111383159A | 公开(公告)日: | 2020-07-07 |
发明(设计)人: | P·苏提;C·本廷;K·维迪雅纳坦;P·劳斯;S·贾纳斯;S·沃普 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘文灿 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 加速 节点 中的 相交 标量 引擎 集群 | ||
1.一种装置,包括:
一组图形核心,其用于执行主图形线程的第一组指令;
标量集群,其包括多个标量执行引擎;以及
通信结构,其将所述一组图形核心和所述标量集群互连;
所述一组图形核心用于将与光线遍历和/或相交操作相关联的第二组指令的执行卸载到所述标量集群;
所述标量集群包括:
指令获取电路,其用于从存储器中的指定区域获取所述第二组指令;
调度器/分派器电路,其用于调度和分派所述第二组指令,以用于在所述多个标量执行引擎的全部或子集上执行;
多个本地存储器,每个本地存储器与所述标量执行引擎之一相关联,其中,每个本地存储器用于存储由相关联的标量执行引擎执行所述第二组指令中的一个或多个指令所需的层次加速度数据结构的一部分;
所述多个标量执行引擎,其用于将所述第二组指令的所述执行的结果存储在能由所述一组图形核心访问的存储器中;其中,所述一组图形核心用于处理所述主图形线程内的所述结果。
2.如权利要求1所述的装置,其中,所述层次加速度数据结构包括包围盒层次(BVH),其中,与所述BVH的节点相关联的节点数据要被存储在所述本地存储器中。
3.如权利要求1或2所述的装置,其中,所述第二组指令包括标量乘法运算和/或标量除法运算。
4.如权利要求1或2所述的装置,其中,所述调度器/分派器电路用于调度所述第二组指令中的多个指令以用于在多个所述标量执行引擎上并行执行。
5.如权利要求4所述的装置,其中,所述标量执行引擎用于并行执行所述第二组指令中的所述多个指令,以执行与光线相交相关联的多个并行标量乘法运算和/或标量除法运算。
6.如权利要求1或5所述的装置,还包括:
多个存储器接口电路,每个存储器接口电路与所述标量执行引擎之一相关联,所述存储器接口电路用于将所述标量执行引擎耦合到由所述一组图形核心共享的系统存储器。
7.如权利要求6所述的装置,其中,所述一组图形核心包括共享高速缓存的多核组(MCG)和用于将所述多核组耦合到所述系统存储器的存储器控制器电路。
8.如权利要求7所述的装置,还包括:
多个附加多核组,其耦合到所述通信结构,所述多个附加多核组中的至少一个附加多核组用于执行包括所述第一组指令的第二主图形线程并且将工作卸载到包括所述第二组指令的所述标量引擎集群。
9.如权利要求8所述的装置,其中,所述第二组指令包括光线相交指令,所述标量执行引擎用于执行标量乘法运算和标量除法运算以实现所述光线相交指令。
10.一种方法,包括:
在一组图形核心上执行主图形线程的第一组指令;
提供包括多个标量执行引擎的标量集群;以及
提供将所述一组图形核心和所述标量集群互连的通信结构;
将与光线遍历和/或相交操作相关联的第二组指令的执行从所述一组图形核心卸载到所述标量集群;
从存储器中的指定区域获取所述第二组指令到所述标量集群;
调度和分派所述第二组指令以用于执行;
在所述多个标量执行引擎的全部或子集上执行所述第二组指令;
其中,所述标量集群的多个本地存储器用于存储由相关联的标量执行引擎所需的层次加速度数据结构的一部分;
将所述第二组指令的所述执行的结果存储在能由所述一组图形核心访问的存储器中;
处理所述主图形线程内的所述结果。
11.如权利要求10所述的方法,其中,所述层次加速度数据结构包括包围盒层次(BVH),其中,与所述BVH的节点相关联的节点数据要被存储在所述本地存储器中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911172075.7/1.html,转载请声明来源钻瓜专利网。