[发明专利]用于实现高效同步和并行归约操作的向量指令有效
申请号: | 201410196526.1 | 申请日: | 2009-03-27 |
公开(公告)号: | CN103970506B | 公开(公告)日: | 2017-07-14 |
发明(设计)人: | M·斯密尔安斯基;S·库玛;D·金;V·W·李;A·D·恩古耶;Y-K·陈;C·休格斯;C·金;J·查乌加尼 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38 |
代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 何焜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 实现 高效 同步 并行 操作 向量 指令 | ||
本发明专利申请是国际申请号为PCT/US2009/038596,国际申请日为2009年3月27日,进入中国国家阶段的申请号为200980110598.7,名称为“用于实现高效同步和并行归约操作的向量指令”的发明专利申请的分案申请。
背景
许多应用有大量数据级并行性且应当能够获益于单指令多数据(SIMD)支持。在SIMD执行中,单条指令同时对多个数据元素进行操作。这典型地通过扩展诸如寄存器和算术逻辑单元(ALU)等各种资源的宽度来实现,从而允许它们分别保持多个数据元素或对多个数据元素进行操作。然而,许多此类应用花费大量时间对一组稀疏位置进行原子操作,因此从SIMD得到的益处有限,因为当前架构不支持原子向量操作。
在许多应用中,常常在多处理器系统中执行同步原语和并行归约(reduction)操作。同步原语确保了在多个线程协同工作时程序按正确次序执行。这些原语常常使用原子读-修改-写操作来实现。归约是许多科学应用中存在的常见操作。当多个线程并行地执行归约时,通常使用原子读-修改-写序列来确保竞态条件下的正确性。
现代并行架构装备有SIMD单元以改善具有数据级并行性的许多应用的性能。为了维持SIMD效率,此类架构不仅允许SIMD算术运算而且还允许SIMD存储器(通过聚集-分散单元)读写。然而,这些架构都不支持SIMD原子操作。结果是这些原子操作不能被向量化,因此必须使用标量代码来实现。这可能使SIMD效率显著降级,尤其是在SIMD宽度(即,同时处理的元素的数目)较大时(例如,16)。
分散归约是许多应用中常见的操作。例如,可以使用分散-相加(scatter-add)操作使得第一阵列的多个值根据通常可为随机的索引分布被归约成(即,相加到)第二阵列的所选元素。正因如此,难以高效地并发(即,以SIMD模式)处理多个元素。
柱状图计算是许多图像处理应用中常见的操作。例如,柱状图被用来跟踪图像中像素的颜色值的分布。然而,对柱状图阵列的更新可能是随机的,取决于阵列的输入数据。具体而言,相邻元素的索引可能指向柱状图中相同的柱。这种状况使得很难并发(即,以SIMD模式)处理多个数据。
附图简述
图1A是根据本发明一个实施例的处理器核的框图。
图1B是根据本发明的实施例的聚集/分散单元的示例表示。
图2是根据本发明一个实施例的用于执行原子向量操作的流程图。
图3是根据本发明的实施例的系统的框图。
详细描述
各实施例可扩展存储器分散-聚集功能以提供对原子向量操作的支持。在各种实施例中,可以提供SIMD指令来实现原子操作。具体而言,可以提供所谓的向量链接聚集(gather-linked)指令和向量条件分散(scatter-conditional)指令从而以SIMD方式高效地支持对多个非连贯存储器位置的原子操作。注意,如本文中所使用的,术语“向量”和“SIMD”被可互换地用来描述由单条指令进行操作的多个数据元素。以此方式,这些指令可实现SIMD原子操作以更加高效地实现同步原语和并行归约操作。此外,其他向量指令可提供处理器辅助以进行处理器内的归约操作和柱状图计算。
在一个实施例中,聚集-分散单元可被配置成允许原子SIMD存储器操作。在其中数据结构具有被间接访问(例如,A[B[i]])而非被连贯访问的元素的应用中高效地利用SIMD常常要求重新安排数据,这可能导致大量开销。为了解决这种开销,可以提供以SIMD方式加载和存储非连贯数据元素的硬件支持来执行聚集/分散操作。即,聚集操作基于源SIMD寄存器中所包含的地址从间接寻址的位置读取(聚集)多个数据元素,并将它们包装在单个SIMD寄存器中。相反,分散操作解包SIMD寄存器中的元素并将它们写(分散)到一组间接寻址的位置中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410196526.1/2.html,转载请声明来源钻瓜专利网。