[发明专利]用于对具有向后的交叉迭代依赖性的循环进行向量化的指令在审
申请号: | 202011548140.4 | 申请日: | 2020-12-24 |
公开(公告)号: | CN113821259A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | M·普洛特尼科夫;H·伊多;I·伯里洛夫;R·阿鲁秋扬 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 任曼怡;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 具有 向后 交叉 依赖性 循环 进行 量化 指令 | ||
1.一种用于使用指令来对具有向后的交叉迭代依赖性的循环进行向量化的装置,所述装置包括:
解码电路,用于对指令进行解码,所述指令包括针对在前向量掩码的先前距离数据的标识符;以及
执行电路,用于执行所述指令以解决循环的一个或多个操作的交叉迭代依赖性,
其中,所述指令用于至少部分地基于到所述循环的在前迭代的一个或多个距离计数计算来解决所述一个或多个操作的所述交叉迭代依赖性。
2.如权利要求1所述的装置,其中,写掩码寄存器用于存储所述先前距离数据。
3.如权利要求1所述的装置,其中,向量寄存器用于存储所述先前距离数据。
4.如权利要求1所述的装置,其中,断言寄存器用于存储所述先前距离数据。
5.如权利要求1所述的装置,其中,所述指令的操作数包括所述先前距离数据的所述标识符。
6.如权利要求1所述的装置,其中,寄存器用于存储所述先前距离数据的所述标识符。
7.如权利要求1所述的装置,其中,所述在前循环迭代与所述交叉迭代依赖性终止所在的位置对应。
8.如权利要求1所述的装置,其中,所述指令用于解决所述循环的所述一个或多个操作的多个交叉迭代依赖性。
9.如权利要求1所述的装置,包括用于以下操作的逻辑:至少部分地基于针对输入掩码的每个位位置到具有未置位的位值的最近位位置的距离计算来确定到所述在前循环迭代的所述一个或多个距离计数计算。
10.如权利要求1所述的装置,其中,所述指令的操作数的部分包括针对所述在前向量掩码的所述先前距离数据。
11.如权利要求1所述的装置,其中,具有一个或多个处理器核的处理器包括所述解码电路、所述执行电路、以及用于存储所述指令的存储器中的一者或多者。
12.如权利要求11所述的装置,其中,所述处理器和所述存储器在单个集成电路管芯上。
13.如权利要求11所述的装置,其中,所述处理器包括具有一个或多个图形处理核的图形处理单元GPU。
14.如权利要求1所述的装置,其中,所述解码电路用于对所述指令进行解码以生成多个微操作、微代码进入点、或者微指令。
15.一种用于使用指令来对具有向后的交叉迭代依赖性的循环进行向量化的方法,所述方法包括:
对指令进行解码,所述指令包括针对在前向量掩码的先前距离数据的标识符;以及
执行所述指令以解决循环的一个或多个操作的交叉迭代依赖性,
其中,所述指令至少部分地基于到所述循环的在前迭代的一个或多个距离计数计算来解决所述一个或多个操作的所述交叉迭代依赖性。
16.如权利要求15所述的方法,进一步包括将所述先前距离数据的所述标识符存储在写掩码寄存器、向量寄存器、和断言寄存器中的一者或多者中。
17.如权利要求15所述的方法,进一步包括:至少部分地基于针对输入掩码的每个位位置到具有未置位的位值的最近位位置的距离计算来确定到所述在前循环迭代的所述一个或多个距离计数计算。
18.一种机器可读介质,包括代码,所述代码在被执行时使机器执行如权利要求1至17中的任一项所述的方法。
19.一种设备,包括用于执行如权利要求1至17中任一项所述的方法的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011548140.4/1.html,转载请声明来源钻瓜专利网。