[发明专利]打包数据重新安排控制索引产生处理器、方法、系统及指令有效
申请号: | 201180075695.4 | 申请日: | 2011-12-22 |
公开(公告)号: | CN104011643B | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | E·乌尔德-阿迈德瓦尔;S·阿布拉罕;R·凡伦天;Z·斯波伯;A·格雷德斯廷 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/06 | 分类号: | G06F9/06;G06F9/30;G06F13/14 |
代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 姬利永 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 打包 数据 重新 安排 控制 索引 产生 处理器 方法 系统 指令 | ||
技术领域
实施例涉及处理器。具体而言,实施例涉及具有指令集的处理器,该指令集包括使用控制索引的指令。
背景技术
许多处理器具有单指令多数据(SIMD)架构。在SIMD架构中,打包数据指令、向量指令或者SIMD指令可同时或并行地对多个数据元素或者多对数据元素进行操作。处理器可具有并行执行硬件,该并行执行硬件响应于打包数据指令来同时或并行地执行多个操作。
多个数据元素可在一个寄存器或存储器位置内被打包为打包数据或向量数据。在打包数据中,寄存器或者其他存储位置的位可逻辑地分成多个数据元素的序列。例如,256位宽打包数据寄存器可具有四个64位宽打包数据元素、八个32位宽打包数据元素、十六个16位宽打包数据元素等。每一打包数据元素可表示单独的各段数据(例如,像素的红色、绿色、蓝色或α颜色分量、或复数的实部或虚部等等),各段数据可单独地操作或与其他数据独立地操作。
一些SIMD架构具有用于根据控制索引在一个或多个源打包数据内灵活地重新安排打包数据元素的指令。此类指令的示例是置换指令和混洗指令。控制索引控制这些指令如何重新安排打包数据元素。
附图说明
通过参考用来说明本发明的实施例的以下描述和附图,可最好地理解本发明。在附图中:
图1是用于处理可用来产生控制索引的指令的处理器的示例实施例的框图。
图2是处理打包数据重新安排控制索引产生指令的示例实施例的方法的示例实施例的流程框图。
图3是处理打包数据重新安排控制索引前体产生指令的示例实施例的方法的示例实施例的流程框图。
图4是用于处理可用来产生控制索引的指令的指令处理装置的示例实施例的框图。
图5是处理存储遵循数值模式的至少四个非负整数的序列的指令的方法的示例实施例的流程框图。
图6是可用来产生控制索引的指令的指令格式的实施例的框图。
图7A是示出在一些实施例中通过指令存储的整数序列可具有主要或完全基于指令的操作码的数值模式的框图。
图7B是框图,示出在一些实施例中,通过指令存储的整数序列可具有部分地基于指令的操作码并且部分地基于由该指令指示的一个或多个数值模式限定参数的数值模式。
图8是处理存储按照数值顺序的至少四个非负整数的序列的指令的方法的示例实施例的流程框图。
图9是示出打包数据重新安排操作的示例实施例的框图,该打包数据重新安排操作使用具有按照数值顺序的偏移连续整数的值的打包数据重新安排控制索引,来从两个经对齐的打包数据中提取未对齐的打包数据以避免需要执行未对齐加载。
图10是处理存储按照数值顺序的至少四个非负整数的序列的指令的方法的示例实施例的流程框图,其中连续位置中的所有整数相差至少为2的恒定整数跨度。
图11是处理存储按照数值顺序的至少四个非负相同奇偶性(例如均为偶数或均为奇数)整数的序列的指令的方法的示例实施例的流程框图。
图12是示出打包数据重新安排操作的示例实施例的框图,该打包数据重新安排操作使用打包数据重新安排控制索引以将实数(R)与虚数(IM)分开,该打包数据重新安排控制索引具有按照递增数值顺序的连续偶数的值。
图13是处理存储按照数值顺序的至少四个整数的序列的指令的方法的示例实施例的流程框图,其中整数中的最小整数从零偏移一偏移量,并且其中连续位置中的所有整数彼此相差一跨度。
图14是处理用于存储按照数值顺序的连续非负整数的序列的第一控制索引前体产生指令和向每一整数应用跨度和偏移量的第二指令的方法的示例实施例的流程框图。
图15是存储红、绿、蓝、α四元数据的源打包数据的框图。
图16是包括存储一个或多个整数序列的只读存储器(ROM)的处理器的示例实施例的框图。
图17A是示出用于存储控制索引和控制索引前体的适当格式的第一示例实施例的框图。
图17B是示出用于存储控制索引和控制索引前体的适当格式的第二示例实施例的框图。
图18是一组合适的打包数据寄存器的示例实施例的框图。
图19是包括存储可用来产生控制索引的指令的机器可读存储介质的制品的框图。
图20A示出示例性AVX指令格式,包括VEX前缀、实操作码字段、Mod R/M字节、SIB字节、位移字段以及IMM8。
图20B示出来自图20A的哪些字段构成完整操作码字段和基础操作字段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180075695.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置