[发明专利]转置指令在审
申请号: | 201180075978.9 | 申请日: | 2011-12-30 |
公开(公告)号: | CN104011672A | 公开(公告)日: | 2014-08-27 |
发明(设计)人: | A·杰哈 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/305 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 何焜 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指令 | ||
发明领域
本发明的领域一般涉及计算机处理器架构,更具体地涉及转置指令。
背景技术
指令集,或指令集架构(ISA)是涉及编程的计算机架构的一部分,并可以包括原生数据类型、指令、寄存器架构、寻址模式、存储器架构,中断和异常处理、以及外部输入和输出(I/O)。应注意术语指令在本文中一般指的是宏指令——即提供给处理器以供执行的指令——与从处理器的解码器解码宏指令得到的微指令或微操作不同。
指令集架构与微架构不同,微架构是实现ISA的处理器的内部设计。带有不同的微架构的处理器可以共享共同的指令集。指令集包括一个或多个指令格式。给定指令格式定义各种字段(位数、位位置)以指定要执行的操作以及将对其进行该操作的操作数等。给定指令是使用给定指令格式来表达的,并指定操作和操作数。指令流是特定指令序列,其中,序列中的每一指令都是指令以指令格式出现。
科学、金融、自动向量化的通用RMS(识别、挖掘以及合成)/可视和多媒体应用(例如,2D/3D图形、图像处理、视频压缩/解压缩、语音识别算法和音频操纵)常常需要对大量的数据项执行相同操作(被称为“数据并行性”)。单指令多数据(SIMD)是指使处理器对多个数据项执行相同操作的一种指令。SIMD技术特别适于能够在逻辑上将寄存器中的位分割为若干个固定尺寸的数据元素的处理器,其中每一个数据元素都表示单独的值。例如,64位寄存器中的位可以被指定为作为四个单独的16位数据元素来操作的源操作数,每一个数据元素都表示单独的16位值。作为另一个示例,256位寄存器中的位可以被指定为作为四个单独的64位打包数据元素(四字(Q)尺寸的数据元素)、八个单独的32位打包数据元素(双字(D)尺寸的数据元素)、十六个单独的16位打包数据元素(字(W)尺寸的数据元素)、或三十二个单独的8位数据元素(字节(B)尺寸的数据元素)来操作的源操作数。这种类型的数据被称为打包数据类型或向量数据类型,这种数据类型的操作数被称为打包数据操作数或向量操作数。换句话说,打包数据项或向量指的是打包数据元素的序列;并且打包数据操作数或向量操作数是SIMD指令(也称为打包数据指令或向量指令)的源操作数或目的地操作数。
转置操作是向量软件中的常见基元。虽然某些指令集架构提供用于执行转置操作的指令,但这些指令通常是混洗或置换,混洗和置换需要使用立即数位或使用单独的向量寄存器来设置混洗控制掩码的额外开销,由此增加了指令有效负荷并增加了尺寸。此外,一些指令集架构的混洗操作是通道内(in-lane)的128位操作。结果,为了进行256位或512位寄存器(作为示例)的完整转置操作,混洗和置换的组合是必须的。
软件应用花费相当百分比的时间在对存储器的加载(LD)和存储(ST)上,其中加载的执行次数通常超过存储的执行次数的两倍。需要多次加载和存储操作的函数中的一些函数几乎不需要计算,诸如存储器清除、存储器复制、转置;而另一些函数采用很少的计算,诸如矩阵点乘、数组求和等等。每个加载操作或存储操作都需要核资源(例如预留站(RS)、重排序缓冲器(ROB)、填充缓冲器、等等)。
附图简述
本发明是作为示例说明的,而不仅受限于各个附图的图形,在附图中,类似的参考编号表示类似的元件,其中:
图1示出根据一个实施例的转置指令的示例性执行;
图2示出根据一个实施例的转置指令的另一示例性执行;
图3是示出根据一个实施例的通过执行单个转置指令来转置向量寄存器或存储器位置中的数据元素的示例性操作的流程图;
图4是示出根据一个实施例的有序架构核和示例性的寄存器重命名的无序发布/执行架构核的示例性实施例的框图,该示例性的寄存器重命名的无序发布/执行架构核包括示例性的高速缓存协处理单元,该高速缓存协处理单元执行已从由处理核的执行群集的执行中卸载的指令;
图5是根据一个实施例的用于执行被卸载的指令的示例性操作的流程图;
图6a示出根据一个实施例的示例性AVX指令格式,包括VEX前缀、实操作码字段、MoD R/M字节、SIB字节、位移字段以及IMM8;
图6B示出根据一个实施例来自图6A的哪些字段构成完整操作码字段和基础操作字段;
图6C示出根据一个实施例来自图6A的哪些字段构成寄存器索引字段;
图7A是示出根据本发明的实施例的通用向量友好指令格式及其A类指令模板的框图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180075978.9/2.html,转载请声明来源钻瓜专利网。