[发明专利]用于对具有向后的交叉迭代依赖性的循环进行向量化的指令在审
申请号: | 202011548140.4 | 申请日: | 2020-12-24 |
公开(公告)号: | CN113821259A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | M·普洛特尼科夫;H·伊多;I·伯里洛夫;R·阿鲁秋扬 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 任曼怡;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 具有 向后 交叉 依赖性 循环 进行 量化 指令 | ||
本申请公开了用于对具有向后的交叉迭代依赖性的循环进行向量化的指令。描述了涉及用于对具有向后的交叉迭代依赖性的循环进行向量化的技术的方法和装置。在实施例中,对一条或多条指令的执行解决了循环的一个或多个操作的交叉迭代依赖性。对一条或多条指令的执行至少部分地基于到循环的在前迭代的一个或多个距离计数计算来解决一个或多个操作的交叉迭代依赖性。还公开并要求保护其他实施例。
技术领域
本公开总体上涉及电子学领域。更具体地,一些实施例涉及用于使用指令来对具有向后的交叉迭代依赖性的循环进行向量化的技术。
背景技术
为了改善性能,一些计算机系统可使用能够进行向量处理的处理器例如来并行地处理大量的数据。例如,向量处理可应用于单指令多数据(SIMD)计算中,其中根据单条指令来处理多个数据流。因此,通过采用向量处理,计算速度和/或效率可以显著获益。
附图说明
因此,为了可详细地理解本文中陈述的当前实施例的特征的方式,可参照实施例进行对实施例的更特定的描述,在所附附图中图示实施例中的一些。然而,应注意的是,所附附图仅图示典型实施例,并且因此不应被视为限制实施例的范围。
图1是根据实施例的具有24个所生成的数字的序列、对每个数字进行条件评估的结果、以及得到的X值和Y值分布的样本图。
图2是根据实施例的具有掩码(01110011)和样本生成的距离的样本图。
图3示出根据实施例的软件仿真序列结果与在整个序列中手动地计算的距离的比较。
图4图示出根据实施例的针对来自图1的前两个向量迭代的示例。
图5示出根据一些实施例的向量化的两个示例。
图6图示出根据实施例的用于对具有向后的交叉迭代依赖性的循环进行向量化的方法的流程图。
图7A是图示根据实施例的示例性指令格式的框图。
图7B是图示根据一个实施例的指令格式中构成完整操作码字段的字段的框图。
图7C是图示根据一个实施例的指令格式中构成寄存器索引字段的字段的框图。
图7D是图示根据一个实施例的指令格式中构成扩充操作字段的字段的框图。
图8是根据一个实施例的寄存器架构的框图。
图9A是图示根据实施例的示例性有序流水线以及示例性寄存器重命名的乱序发布/执行流水线两者的框图。
图9B是图示根据实施例的要包括在处理器中的有序架构核的示例性实施例和示例性的寄存器重命名的乱序发布/执行架构核两者的框图。
图10图示根据实施例的SOC(芯片上系统)封装的框图。
图11是根据实施例的处理系统的框图。
图12是根据一些实施例的具有一个或多个处理器核的处理器的实施例的框图。
图13是根据实施例的图形处理器的框图。
具体实施方式
在下列描述中,阐述了众多特定细节以便提供对各实施例的全面理解。然而,在没有这些特定细节的情况下,也可实施各实施例。在其他实例中,未详细描述公知的方法、过程、组件和电路,以免使特定实施例变得模糊。此外,各实施例的各方面可使用各种装置来执行,诸如集成半导体电路(“硬件”)、组织成一个或多个程序的计算机可读指令(“软件”)、或硬件与软件的某种组合。出于本公开的目的,对“逻辑”的引用应当意指硬件、软件、固件或它们的某种组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011548140.4/2.html,转载请声明来源钻瓜专利网。