[发明专利]用于具有推测支持的向量化的装置和方法有效
申请号: | 201180075857.4 | 申请日: | 2011-12-23 |
公开(公告)号: | CN104025022B | 公开(公告)日: | 2017-09-19 |
发明(设计)人: | J·巴拉德瓦杰;V·W·李;D·金;N·万苏德范;T-F·奈;A·哈特诺;S·S·巴格索克希 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/06 | 分类号: | G06F9/06;G06F9/30 |
代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 何焜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 具有 推测 支持 量化 装置 方法 | ||
1.一种处理器,用于提供实现推测支持的向量化,所述处理器包括:
解码单元,用于解码指令;以及
执行单元,与所述解码单元耦合并用于响应于所述指令:
从输入向量寄存器连续读取每个有效元素,每个有效元素指定聚集或加载操作的地址;
检测与一个或多个有效元素相关联的一个或多个错误状况;
在检测到的除了第一有效元素之外的元素上的错误状况之前,对于连续读取的每个有效元素,将从与所述有效元素相关联的地址加载的数据存储在输出向量寄存器中;
对于与检测到的错误状况相关联的以及在所检测到的错误状况之后的每个有效元素:
设置输出掩码寄存器中的位以指示所检测到的错误状况,以及
如果有效元素不是所述第一有效元素,则将从所述有效元素加载的数据存储在所述输出向量寄存器中;以及
基于所述加载的数据对于有效元素执行所述聚集或加载操作。
2.如权利要求1所述的处理器,其特征在于,响应于所述指令,所述执行单元进一步用于:
在对任何检测到的错误状况进行服务之后,将从与第一有效元素相关联的地址加载的数据存储在所述输出向量寄存器中。
3.如权利要求1所述的处理器,其特征在于,响应于所述指令,所述执行单元进一步用于:
从输入掩码寄存器连续读取每个位,每个位具有用于指示从输入向量寄存器读取的每个有效元素的真值和用于指示从所述输入向量寄存器读取的每个无效元素的假值。
4.如权利要求3所述的处理器,其特征在于,所述输入掩码寄存器包括与所述输出掩码寄存器相同的物理寄存器。
5.如权利要求1所述的处理器,其特征在于,响应于所述指令,所述执行单元进一步用于:
将基址值与从输入向量寄存器读取的每个地址相加,以得出所述聚集或加载操作的存储器地址;以及
在所检测到的错误状况之前,对于每个有效元素,将从每个存储器地址加载的数据存储在输出向量寄存器中。
6.一种用于在处理器中提供实现推测支持的向量化的方法,包括:
从输入向量寄存器连续读取每个有效元素,每个有效元素指定聚集或加载操作的地址;
检测与一个或多个有效元素相关联的一个或多个错误状况;
在检测到的除了第一有效元素之外的元素上的错误状况之前,对于连续读取的每个有效元素,将从与所述有效元素相关联的地址加载的数据存储在输出向量寄存器中;
对于与检测到的错误状况相关联的以及在所检测到的错误状况之后的每个有效元素:
设置输出掩码寄存器中的位以指示所检测到的错误状况;以及
如果有效元素不是所述第一有效元素,则将从所述有效元素加载的数据存储在所述输出向量寄存器中;以及
通过所述处理器基于所述加载的数据对于有效元素执行所述聚集或加载操作。
7.如权利要求6所述的方法,其特征在于,进一步包括:
在对任何检测到的错误状况进行服务之后,将从与所述第一有效元素相关联的地址加载的数据存储在所述输出向量寄存器中。
8.如权利要求6所述的方法,其特征在于,还包括:
从输入掩码寄存器连续读取每个位,每个位具有用于指示从输入向量寄存器读取的每个有效元素的真值和用于指示从所述输入向量寄存器读取的每个无效元素的假值。
9.如权利要求8所述的方法,其特征在于,所述输入掩码寄存器包括与所述输出掩码寄存器相同的物理寄存器。
10.如权利要求6所述的方法,其特征在于,还包括:
将基址值与从输入向量寄存器读取的每个地址相加,以得出所述聚集或加载操作的存储器地址;以及
在所检测到的错误状况之前,对于每个有效元素,将从每个存储器地址加载的数据存储在输出向量寄存器中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180075857.4/1.html,转载请声明来源钻瓜专利网。