[发明专利]使用脉动阵列在并行计算机器中计算高效的跨通道运算在审
申请号: | 202011558163.3 | 申请日: | 2020-12-25 |
公开(公告)号: | CN113590198A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | S·马伊尤兰;J·帕拉;S·帕尔;C·古拉姆 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 脉动 阵列 并行 计算 机器 高效 通道 运算 | ||
公开了一种用于促进使用脉动阵列在并行计算机器中计算高效的跨通道运算的装置。该装置包括多个寄存器和可通信地耦合到多个寄存器的一个或多个处理元件。一个或多个处理元件包括脉动阵列电路,用于对从多个寄存器中的单个源寄存器接收的源数据执行跨通道运算,该脉动阵列电路被修改以从单个源寄存器接收输入,并且将单个源寄存器的元素路由到脉动阵列电路中的多个通道。
交叉引用
本申请涉及Subramaniam Maiyuran等人于2020年5月1日提交的题为“COMPUTINGEFFICIENT CROSS CHANNEL OPERATIONS IN PARALLEL COMPUTING MACHINES USINGSYSTOLIC ARRAYS”的印度专利申请202041018637(代理人案卷号AC8414-IN-Z),并且根据U.S.C.119要求该申请的权益和优先权,该申请的内容通过引用合并于本文中。
技术领域
本公开总体上涉及数据处理,并且更具体地涉及使用脉动阵列在并行计算机器中计算高效的跨通道运算。
背景技术
当前的并行图形数据处理包括被开发用于对图形数据执行诸如线性插值、曲面细分、光栅化、纹理映射、深度测试等之类的特定操作的系统和方法。传统上,图形处理器使用固定功能计算单元处理图形数据;然而,最近,图形处理器的某些部分已变得可编程,从而使此类处理器能够支持用于处理顶点和片段数据的多种多样的操作。
为了进一步提高性能,图形处理器典型地实现诸如流水线化之类的处理技术,这些技术尝试在图形流水线的不同部分中并行处理尽可能多的图形数据。具有单指令多数据(SIMD)或单指令多线程(SIMT)架构的并行图形处理器被设计用于使图形流水线中的并行处理的量最大化。在SIMD架构中,具有多个处理元件的计算机尝试同时对多个数据点执行相同的操作。在SIMT架构中,并行线程组尝试尽可能频繁地一起同步执行程序指令,以提高处理效率。
附图说明
因此,可以通过参考实施例获得可以详细地理解本发明的上面引述的特征的方式、上面简要概述的对实施例更具体的描述,实施例中的一些在附图中示出。然而,应该注意到附图仅示出了典型的实施例,因此不应该被认为限制其范围。
图1是处理系统的框图;
图2A-2D示出了计算系统和图形处理器;
图3A-3C示出了附加图形处理器和计算加速器架构的框图;
图4是图形处理器的图形处理引擎的框图;
图5A-5B示出了线程执行逻辑,该线程执行逻辑包括在图形处理器核心中采用的处理元件的阵列;
图6示出了附加执行单元;
图7是示出图形处理器指令格式的框图;
图8是附加图形处理器架构的框图;
图9A-9B示出了图形处理器命令格式和命令序列;
图10示出了用于数据处理系统的示例性图形软件架构;
图11A是示出IP核心开发系统的框图;
图11B示出了集成电路封装组装件的横截面侧视图;
图11C示出了包括连接至衬底(例如,基础管芯)的硬件逻辑小芯片的多个单元的封装组装件;
图11D示出了包括可互换小芯片的封装组装件;
图12是示出示例性片上系统集成电路的框图;
图13A-13B是示出用于在SoC内使用的示例性图形处理器的框图;
图14是示出根据本公开的实现方式的脉动阵列的框图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011558163.3/2.html,转载请声明来源钻瓜专利网。