[发明专利]用于在运行时的指令的上下文向量化的系统和方法在审
申请号: | 201780007959.X | 申请日: | 2017-01-26 |
公开(公告)号: | CN108475198A | 公开(公告)日: | 2018-08-31 |
发明(设计)人: | T.W.基德;M.S.沃尔什 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/48 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 姜冰;郑冀之 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指令 处理器 标识符 指令存储装置 序列结束 序列开始 源操作数 运行时 优化 方法和装置 获取电路 获取指令 解码电路 解码指令 分派 解码 操作码 查找表 向量化 缓冲 电路 检测 替代 访问 | ||
公开了涉及在运行时与上下文有关地优化指令的处理器的方法和装置。在一个实施例中,处理器包括用于从指令存储装置获取指令的获取电路,该指令的格式包括操作码、第一源操作数标识符和第二源操作数标识符;其中指令存储装置包括次优指令的序列,其前面是序列开始指令,后面是序列结束指令。所公开的处理器还包括解码电路,以解码指令,以检测序列开始指令和序列结束指令,以缓冲它们之间的次优指令的序列,以访问查找表以标识一个或多个优化指令来用于替代次优指令的序列中的一个或多个,以及以选择要分派给执行电路的所解码的指令或一个或多个优化指令的序列。
技术领域
本文描述的实施例一般涉及处理器。特别地,所描述的实施例一般涉及配置成在运行时与上下文有关地优化指令的处理器。
背景技术
并行处理一般比一次一个数据点的标量执行更快。具有多个处理元件的单指令多数据(SIMD)计算机(其在多个数据点上执行相同的操作)通过利用并行性和同时使用多个并行执行核来达到性能提升。
SIMD处理器可以在执行数学运算中和移动数据中利用并行性。SIMD处理器可以同时加载或存储多个数据项,与一次加载或存储一个数据的较慢的标量处理器相比,引起性能提升。当在具有并行资源的处理器上执行计算机程序时,利用SIMD指令比使用标量指令提供更好的性能。
然而,使用SIMD指令集架构(ISA)进行编程可以是有挑战性的。例如,SIMD ISA通常是处理器特定的。使用SIMD指令的程序可能需要被重新编写和定制,以适应新处理器世代。对将标量指令适配新指令集架构所需的工作可能需要部分或全部重复以用于与指令集架构的每个新世代(例如MMX、SSE、SSE2、SSE3、SSE4、AVX、AVX 2、AVX 3.1和AVX 3.2)重复使用,所述所需的工作包括重写代码、为代码制作文档;使编译器能够发出(emit)代码,培训用户使用代码,调试和收集代码执行的记录。因此,所需要的是一种允许程序员利用SIMD指令集架构同时避免传统解决方案中固有的挑战的方法。
此外,传统的解决方案是受限的,因为它们在执行期间提前静态地而不是动态地优化代码。编译器试图优化某些代码序列的执行,但它们在不知道机器或寄存器的状态的情况下在静态环境中操作。即使是传统上人工编码的SIMD代码也不能够根据机器和寄存器的运行时状态来优化代码。因此,需要一种在知道寄存器的状态及其内容的情况下在运行时优化指令的方法。
附图说明
图1是示出根据一个实施例的对于处理器用于在运行时与上下文有关地优化指令的过程的流程框图。
图2是示出根据一个实施例的由处理器用于在运行时与上下文有关地优化指令的处理组件的框图。
图3示出了根据一个实施例的指令及其各种字段。
图4示出了根据一实施例的由优化表2的Vectorbeam代码的处理器进行的示例性寄存器分配。
图5示出了根据一个实施例的用于并行处理图4的分配的寄存器的多个计算资源的示例性分配。
图6示出了根据一个实施例的列示对于标量指令的向量指令替代物的查找表的一部分。
图7示出了根据一个实施例的向量处理器寄存器堆。
具体实施方式
在以下描述中,阐述了许多特定细节。然而,应该理解,可以在没有这些特定细节的情况下实践本公开的实施例。在其它实例中,未详细示出公知电路、结构和技术,以便不使本描述的理解晦涩。
说明书中对“一个实施例”、“一实施例”、“示例实施例”等的引用指示所描述的实施例可以包括具体特征、结构或特性,但是每个实施例不一定包括该特定的特征、结构或特征。而且,此类短语不一定指的是同一实施例。此外,当结合实施例描述具体特征、结构或特性时,认为结合其他实施例来影响此类特征、结构或特性在本领域技术人员的知识内,无论是否明确描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780007959.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于嵌套抢占的高速缓存结构
- 下一篇:用于执行密钥值查找指令的处理设备