[发明专利]打包数据重新安排控制索引产生处理器、方法、系统及指令有效

专利信息
申请号: 201180075695.4 申请日: 2011-12-22
公开(公告)号: CN104011643B 公开(公告)日: 2018-01-05
发明(设计)人: E·乌尔德-阿迈德瓦尔;S·阿布拉罕;R·凡伦天;Z·斯波伯;A·格雷德斯廷 申请(专利权)人: 英特尔公司
主分类号: G06F9/06 分类号: G06F9/06;G06F9/30;G06F13/14
代理公司: 上海专利商标事务所有限公司31100 代理人: 姬利永
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 打包 数据 重新 安排 控制 索引 产生 处理器 方法 系统 指令
【说明书】:

技术领域

实施例涉及处理器。具体而言,实施例涉及具有指令集的处理器,该指令集包括使用控制索引的指令。

背景技术

许多处理器具有单指令多数据(SIMD)架构。在SIMD架构中,打包数据指令、向量指令或者SIMD指令可同时或并行地对多个数据元素或者多对数据元素进行操作。处理器可具有并行执行硬件,该并行执行硬件响应于打包数据指令来同时或并行地执行多个操作。

多个数据元素可在一个寄存器或存储器位置内被打包为打包数据或向量数据。在打包数据中,寄存器或者其他存储位置的位可逻辑地分成多个数据元素的序列。例如,256位宽打包数据寄存器可具有四个64位宽打包数据元素、八个32位宽打包数据元素、十六个16位宽打包数据元素等。每一打包数据元素可表示单独的各段数据(例如,像素的红色、绿色、蓝色或α颜色分量、或复数的实部或虚部等等),各段数据可单独地操作或与其他数据独立地操作。

一些SIMD架构具有用于根据控制索引在一个或多个源打包数据内灵活地重新安排打包数据元素的指令。此类指令的示例是置换指令和混洗指令。控制索引控制这些指令如何重新安排打包数据元素。

附图说明

通过参考用来说明本发明的实施例的以下描述和附图,可最好地理解本发明。在附图中:

图1是用于处理可用来产生控制索引的指令的处理器的示例实施例的框图。

图2是处理打包数据重新安排控制索引产生指令的示例实施例的方法的示例实施例的流程框图。

图3是处理打包数据重新安排控制索引前体产生指令的示例实施例的方法的示例实施例的流程框图。

图4是用于处理可用来产生控制索引的指令的指令处理装置的示例实施例的框图。

图5是处理存储遵循数值模式的至少四个非负整数的序列的指令的方法的示例实施例的流程框图。

图6是可用来产生控制索引的指令的指令格式的实施例的框图。

图7A是示出在一些实施例中通过指令存储的整数序列可具有主要或完全基于指令的操作码的数值模式的框图。

图7B是框图,示出在一些实施例中,通过指令存储的整数序列可具有部分地基于指令的操作码并且部分地基于由该指令指示的一个或多个数值模式限定参数的数值模式。

图8是处理存储按照数值顺序的至少四个非负整数的序列的指令的方法的示例实施例的流程框图。

图9是示出打包数据重新安排操作的示例实施例的框图,该打包数据重新安排操作使用具有按照数值顺序的偏移连续整数的值的打包数据重新安排控制索引,来从两个经对齐的打包数据中提取未对齐的打包数据以避免需要执行未对齐加载。

图10是处理存储按照数值顺序的至少四个非负整数的序列的指令的方法的示例实施例的流程框图,其中连续位置中的所有整数相差至少为2的恒定整数跨度。

图11是处理存储按照数值顺序的至少四个非负相同奇偶性(例如均为偶数或均为奇数)整数的序列的指令的方法的示例实施例的流程框图。

图12是示出打包数据重新安排操作的示例实施例的框图,该打包数据重新安排操作使用打包数据重新安排控制索引以将实数(R)与虚数(IM)分开,该打包数据重新安排控制索引具有按照递增数值顺序的连续偶数的值。

图13是处理存储按照数值顺序的至少四个整数的序列的指令的方法的示例实施例的流程框图,其中整数中的最小整数从零偏移一偏移量,并且其中连续位置中的所有整数彼此相差一跨度。

图14是处理用于存储按照数值顺序的连续非负整数的序列的第一控制索引前体产生指令和向每一整数应用跨度和偏移量的第二指令的方法的示例实施例的流程框图。

图15是存储红、绿、蓝、α四元数据的源打包数据的框图。

图16是包括存储一个或多个整数序列的只读存储器(ROM)的处理器的示例实施例的框图。

图17A是示出用于存储控制索引和控制索引前体的适当格式的第一示例实施例的框图。

图17B是示出用于存储控制索引和控制索引前体的适当格式的第二示例实施例的框图。

图18是一组合适的打包数据寄存器的示例实施例的框图。

图19是包括存储可用来产生控制索引的指令的机器可读存储介质的制品的框图。

图20A示出示例性AVX指令格式,包括VEX前缀、实操作码字段、Mod R/M字节、SIB字节、位移字段以及IMM8。

图20B示出来自图20A的哪些字段构成完整操作码字段和基础操作字段。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201180075695.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top