[发明专利]用于提供向量分散操作和聚集操作功能的指令和逻辑有效
申请号: | 201180073668.3 | 申请日: | 2011-09-26 |
公开(公告)号: | CN103827813A | 公开(公告)日: | 2014-05-28 |
发明(设计)人: | E·乌尔德-阿迈德-瓦尔;K·A·杜什;C·R·扬特;S·赛尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/305;G06F9/06 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 何焜 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 提供 向量 分散 操作 聚集 功能 指令 逻辑 | ||
技术领域
本公开涉及处理逻辑、微处理器以及相关的指令集体系结构的领域,这些指令集体系结构在被处理器或其他处理逻辑所执行时运行逻辑、数学或其他功能性操作。具体而言,本公开涉及用于提供向量分散操作和/或聚集操作功能的指令和逻辑。
背景技术
目前的诸多处理器通常包括用于提供计算密集型操作但提供高度数据并行性的指令,这些指令可通过使用多种数据存储设备的高效实现来使用,这些数据存储设备诸如:单指令多数据(SIMD)向量寄存器。
将应用或软件代码向量化可包括使该应用在特定系统或指令集体系结构(诸如例如宽或大宽度向量体系结构)上编译、安装和/或运行。对于一些应用,由于向量宽度增加(例如用于诸如三维(3D)图像渲染之类的操作),存储器访问可能是复杂的、不一致的或不连续的。用于向量化进程的存储器可能被存储在不连续或不邻近的存储器位置中。多种体系结构可能需要额外的指令,这些额外的指令最小化了指令吞吐量,并显著增加在执行任何算术操作之前对寄存器中的数据进行排序所需的时钟周期的数量。
用于改善存储器访问和对去往和来自更宽向量的数据进行排序的机制可包括实现聚集和分散操作,以针对来自其他非本地和/或不连续的存储器位置的数据产生本地连续的存储器访问。聚集操作可从存储装置中的一组不连续或随机的存储器位置收集数据,并将不同的数据组合到打包结构中。分散操作可将打包结构中的元素散开至一组不连续或随机的存储器位置。这些存储器位置中的一些可能未被高速缓存,或已经被移出物理存储器的分页。
如果聚集操作由于页面错误或一些其他原因而中断,在一些体系结构下,机器的状态可能未保存,从而需要重复整个聚集操作,而不是在聚集操作中断的位置处重新开始。由于在任一聚集操作上可能需要多次存储器访问,所以可能需要许多时钟周期来完成,任何后续的依赖算术操作必须等待该聚集操作完成。这样的延迟代表瓶颈,该瓶颈会限制例如从宽或大宽度向量体系结构原本预期的性能优势。
到目前为止,尚未充分探索针对这样的性能受限问题和瓶颈的潜在解决方案。
附图说明
在附图的各图中通过示例而非限制地示出本发明。
图1A是执行用于提供向量分散操作和/或聚集操作功能的指令的系统的一个实施例的框图。
图1B是执行用于提供向量分散操作和/或聚集操作功能的指令的系统的另一实施例的框图。
图1C是执行用于提供向量分散操作和/或聚集操作功能的指令的系统的另一实施例的框图。
图2是执行用于提供向量分散操作和/或聚集操作功能的指令的处理器的一个实施例的框图。
图3A示出根据一个实施例的打包数据类型。
图3B示出根据一个实施例的打包数据类型。
图3C示出根据一个实施例的打包数据类型。
图3D示出根据一个实施例的编码成用于提供向量分散操作和/或聚集操作功能的指令。
图3E示出根据另一实施例的编码成用于提供向量分散操作和/或聚集操作功能的指令。
图3F示出根据另一实施例的编码成用于提供向量分散操作和/或聚集操作功能的指令。
图3G示出根据另一实施例的编码成用于提供向量分散操作和/或聚集操作功能的指令。
图3H示出根据另一实施例的编码成用于提供向量分散操作和/或聚集操作功能的指令。
图4A示出用于执行提供向量分散操作和/或聚集操作功能的指令的处理器微体系结构的一个实施例的要素。
图4B示出用于执行提供向量分散操作和/或聚集操作功能的指令的处理器微体系结构的另一实施例的要素。
图5是用于执行提供向量分散操作和/或聚集操作功能的指令的处理器的一个实施例的框图。
图6是用于执行提供向量分散操作和/或聚集操作功能的指令的计算机系统的一个实施例的框图。
图7是用于执行提供向量分散操作和/或聚集操作功能的指令的计算机系统的另一实施例的框图。
图8是用于执行提供向量分散操作和/或聚集操作功能的指令的计算机系统的另一实施例的框图。
图9是用于执行提供向量分散操作和/或聚集操作功能的指令的芯片上系统的一个实施例的框图。
图10是用于执行提供向量分散操作和/或聚集操作功能的指令的处理器的实施例的框图。
图11是提供向量分散操作和/或聚集操作功能的IP核开发系统的一个实施例的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180073668.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光纤连接器
- 下一篇:光学滤波器装置及电子设备