[发明专利]冲突掩码生成有效
申请号: | 201580085489.X | 申请日: | 2015-12-24 |
公开(公告)号: | CN108475242B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 金君;E·乌尔德-阿迈德-瓦尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F13/16 | 分类号: | G06F13/16 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 何焜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 冲突 掩码 生成 | ||
描述了单指令多数据(SIMD)技术。一种处理装置可以包括处理器核和存储器。所述处理器核可以生成包括多个位的第一位图,其中,所述多个位包括表示第一存储器位置的第一位。所述处理器核可以确定所述第一位图中所述第一位的值等于第二位的值。所述处理器核可以确定所述第一位图中所述第二位关于所述第一位的位置。所述处理器核可以生成包括第三位的第二位图,所述第三位指示所述第一位是所述第一位图中具有与所述第二位相同值的最后一位。
背景技术
可以在微处理器系统中实施单指令多数据(SIMD)架构以便使一个指令能够并行地对若干操作数进行操作。SIMD架构利用将多个数据元素紧缩在一个寄存器或连续的存储器位置中。利用并行硬件执行,通过一个指令对多个分开的数据元素执行多个操作以便提高微处理器系统的性能。
附图说明
根据以下给出的详细描述以及本发明的各个实施例的附图,将更全面地理解本发明的各个实施例。
图1A展示了根据一个实施例的耦合到处理器以执行单指令多数据(SIMD)操作的存储器装置的图示。
图1B展示了根据一个实施例的一种将数据写入存储器中位置以用于收集-修改-分散操作的方法的图示。
图1C展示了根据一个实施例的一种将数据写入存储器中位置以用于收集-修改-分散操作的方法的另一个图示。
图2展示了根据一个实施例的实施掩码操作的SIMD指令。
图3A是框图,展示了根据一个实施例的有序流水线和寄存器重命名级、无序发布/执行流水线。
图3B是框图,展示了根据一个实施例的实施安全存储器重新分区的处理器的微架构。
图4展示了根据一个实施例的处理器的微架构的框图,所述处理器包括用于执行安全存储器重新分区的逻辑电路。
图5是根据一种实施方式的计算机系统的框图。
图6是根据另一种实施方式的计算机系统的框图。
图7是根据一种实施方式的芯片上系统的框图。
图8展示了根据一种实施方式的计算系统的框图的另一种实施方式。
图9展示了根据一种实施方式的计算系统的框图的另一种实施方式。
具体实施方式
许多处理器使用向量指令集或单指令多数据(SIMD)指令集来并行执行多个操作。处理器可以并行执行多个操作,同时将操作应用于同一条数据或同时应用于多条数据。向量化是用于将一次仅对一对操作数进行操作的标量程序转换成可以根据单个指令运行多个操作的向量程序的操作。例如,向量化是重写循环操作以执行SIMD指令的过程,在此过程中,其同时处理数组的M个元素N/M次,而不是处理数组的单个元素N次。
向量化可以包括用于执行收集操作、修改操作和分散操作的指令(如稀疏更新指令)。收集操作和分散操作可以间接访问存储器中的寄存器。例如,收集操作使用有索引的读取,并且分散操作使用有索引的写入。在一个示例中,数据元素可以位于非连续存储器位置。收集操作从存储器位置读取一组数据元素,并且将这些数据元素聚合到单个寄存器或高速缓存行中。修改操作修改所述一组数据元素中的一个或多个数据元素。分散操作将采用紧缩数据结构的数据元素写入一组非连续或随机的存储器位置。
常规地,使用SIMD指令集的处理器具有有限的性能提高,因为应用具有无规律的存储器访问模式。例如,存储需要对数据元素进行频繁且随机更新的数据表的应用不存储在连续存储器位置并且需要对数据进行重新安排以便充分利用SIMD指令集。对数据进行重新安排导致了大量开销并且限制了使用SIMD指令集的效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580085489.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于SPI的数据传输方法及装置
- 下一篇:加速网络分组处理