[发明专利]用于混洗浮点或整数值的装置和方法在审
申请号: | 202210215079.4 | 申请日: | 2011-12-23 |
公开(公告)号: | CN114721721A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | R·凡伦天;E·乌尔德-阿迈德-瓦尔;J·考博尔;T·尤里尔;B·L·托尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/308 | 分类号: | G06F9/308;G06F9/315;G06F9/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈依心;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 浮点 整数 装置 方法 | ||
1.一种处理器,用于执行一个或多个指令,所述处理器包括:
解码器电路,用于解码指令,所述指令具有用于标识第一源寄存器的字段、用于标识第二源寄存器的字段、用于存储立即数的字段、用于标识目的地寄存器的字段、以及操作码;
执行电路,用于执行经过解码的所述指令,从而基于所述操作码,将数据元素从所标识的第一源寄存器和所标识的第二源寄存器混洗到所述目的地寄存器中,其中所述立即数确定所标识的第一源寄存器和所标识的第二源寄存器中的哪个数据元素要被混洗到所标识的目的地寄存器中,其中基于所标识的目的地寄存器中的数据元素的位置决定混洗来自所标识的第一源寄存器还是来自所标识的第二源寄存器的数据元素。
2.如权利要求1所述的处理器,其特征在于,所述指令还包括用于标识掩码数据结构的字段,所述执行电路进一步用于读取存储在掩码数据结构中的每个掩码位,所述掩码数据结构包括和所标识的目的地寄存器中的数据元素相关联的掩码位,所述掩码位用于确定所混洗的数据元素是否要被存储在所标识的目的地寄存器中。
3.如权利要求1所述的处理器,其特征在于,在所述目的地寄存器中的每个数据元素包括128位的数据。
4.如权利要求1所述的处理器,其特征在于,在所述第一和第二源寄存器中的每个数据元素包括128位的数据。
5.一种用于指令执行的方法,包括:
解码指令,所述指令具有用于标识第一源寄存器的字段、用于标识第二源寄存器的字段、用于存储立即数的字段、用于标识目的地寄存器的字段、以及操作码;
执行经过解码的所述指令,从而基于所述操作码,将数据元素从所标识的第一源寄存器和所标识的第二源寄存器混洗到所述目的地寄存器中,其中所述立即数确定所标识的第一源寄存器和所标识的第二源寄存器中的哪个数据元素要被混洗到所标识的目的地寄存器中,其中基于所标识的目的地寄存器中的数据元素的位置决定混洗来自所标识的第一源寄存器还是来自所标识的第二源寄存器的数据元素。
6.如权利要求5所述的方法,其特征在于,所述指令还包括用于标识掩码数据结构的字段,所述执行进一步读取存储在掩码数据结构中的每个掩码位,所述掩码数据结构包括和所标识的目的地寄存器中的数据元素相关联的掩码位,所述掩码位用于确定所混洗的数据元素是否要被存储在所标识的目的地寄存器中。
7.如权利要求5所述的方法,其特征在于,在所述目的地寄存器中的每个数据元素包括128位的数据。
8.如权利要求5所述的方法,其特征在于,在所述第一和第二源寄存器中的每个数据元素包括128位的数据。
9.一种方法,包括:
使用x86编译器编译采用高级程序语言的程序,以生成由具有至少一个x86指令集核的第一处理器原生执行的x86二进制代码;
使用指令转换器,将所述x86二进制代码转换成能够由不具有x86指令集核的第二处理器原生执行的替代二进制代码。
10.一种处理器核,包括:
指令解码器;
与所述指令解码器耦合的标量单元,所述标量单元使用标量寄存器;
与所述指令解码器耦合的矢量单元,所述矢量单元使用矢量寄存器;以及
L1高速缓存,其允许对所述标量寄存器和所述矢量寄存器的低等待时间访问,
所述处理器核使用全局L2高速缓存的本地子集,并具有对所述本地子集的直接访问路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210215079.4/1.html,转载请声明来源钻瓜专利网。