[发明专利]用于累积式求和的系统、装置和方法在审
申请号: | 201780037388.4 | 申请日: | 2017-06-14 |
公开(公告)号: | CN109328334A | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | W·M·布朗;E·乌尔德-阿迈德-瓦尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 李炜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据元素位置 操作数 紧缩 指令 数据源 字段 存储 方法和装置 方法描述 结果存储 源操作数 操作码 累积式 求和 加法 相加 | ||
描述了用于执行指令的系统、方法和装置。例如,指令至少包括操作码、用于紧缩数据源操作数的字段以及用于紧缩数据目的地操作数的字段。当被执行时,该指令导致:对于源操作数的每个数据元素位置,将存储在紧缩数据源操作数的在先数据元素位置中的所有值与存储在那个数据元素位置中的值相加,并将加法的结果存储到紧缩数据目的地操作数的对应的数据元素位置中。
技术领域
本发明的领域总体上关于计算机处理器架构,更具体地关于当被执行时导致特定结果的指令。
背景技术
指令集或指令集架构(ISA)是计算机架构中与编程有关的部分,并且可包括原生数据类型、指令、寄存器架构、寻址模式、存储器架构、中断和异常处置以及外部输入和输出(I/O)。应当注意,术语“指令”在本文中一般是指宏指令——即,提供给处理器供执行的指令,该宏指令与微指令或微操作形成对照,微指令或微操作由处理器的解码器对宏指令解码而产生。
指令集架构与微架构不同,微架构是实现ISA的处理器的内部设计。具有不同微架构的处理器可共享共同的指令集。例如,英特尔奔腾四(Pentium4)处理器、英特尔酷睿(Core)处理器、以及来自加利福尼亚州桑尼威尔市的超微半导体有限公司的处理器实现几乎相同版本的x86指令集(具有已随更新的版本加入的一些扩展),但具有不同的内部设计。例如,可使用公知技术,在不同的微架构中,以不同的方式来实现ISA的相同寄存器架构,这些公知技术包括专用物理寄存器、使用寄存器重命名机制(诸如,使用如在美国专利第5,446,912号中描述的寄存器别名表(RAT)、重排序缓冲器(ROB)以及引退寄存器堆;使用如在美国专利第5,207,132号中描述的多个映射和寄存器池)的一个或多个动态分配的物理寄存器等。除非另外指定,否则短语“寄存器架构”、“寄存器堆”和“寄存器”指代对软件/编程者以及对指令指定寄存器的方式可见的寄存器架构、寄存器堆和寄存器。在需要专用性的情况下,形容词“逻辑的”、“架构的”、或“软件可见的”将用于指示寄存器架构中的寄存器/寄存器堆,而不同的形容词将用于指定给定微架构中的寄存器(例如,物理寄存器、重排序缓冲器、引退寄存器、寄存器池)。
指令集包括一个或多个指令格式。给定的指令格式定义各种字段(位的数目、位的位置)以指定将要被执行的操作以及将要对其执行那个操作的(多个)操作数,等等。给定的指令使用给定的指令格式来表达,并且指定操作和操作数。指令流是特定的指令序列,其中,该序列中的每条指令是指令按指令格式的出现。
科学应用、金融应用、自动向量化通用应用、RMS(识别、挖掘和合成)应用/视觉和多媒体应用(例如,2D/3D图形、图像处理、视频压缩/解压缩、语音识别算法和音频处理)通常需要对大量数据项执行相同的操作(被称为“数据并行性”)。单指令多数据(SIMD)是指使处理器对多个数据项执行同一操作的指令类型。SIMD技术尤其适用于可将寄存器中的多个位逻辑地划分成多个固定尺寸的数据元素(这些数据元素中的每个数据元素表示单独的值)的处理器。例如,64位寄存器中的多个位可被指定为要作为四个单独的16位数据元素而被操作的源操作数,这四个单独的16位数据元素中的每一个都表示单独的16位的值。作为另一示例,可将256位寄存器中的多个位指定为将以下列形式被操作的源操作数:四个单独的64位紧缩数据元素(四字(Q)尺寸数据元素)、八个单独的32位紧缩数据元素(双字(D)尺寸数据元素)、十六个单独的16位紧缩数据元素(字(W)尺寸数据元素)或三十二个单独的8位数据元素(字节(B)尺寸数据元素)。该数据类型被称为紧缩数据类型或向量数据类型,并且该数据类型的操作数被称为紧缩数据操作数或向量操作数。换句话说,紧缩数据项或向量指的是紧缩数据元素的序列;并且紧缩数据操作数或向量操作数是SIMD指令(也称为紧缩数据指令或向量指令)的源操作数或目的地操作数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780037388.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于累积式乘积的系统、装置和方法
- 下一篇:智能配置发现技术