[发明专利]汇聚和散布多个数据元素有效
申请号: | 201410401488.9 | 申请日: | 2010-12-22 |
公开(公告)号: | CN104317791B | 公开(公告)日: | 2018-03-13 |
发明(设计)人: | C·J·休斯;Y-K(Y.K.)·陈;M·博姆;J·W·布兰特;M·J·巴克斯顿;M·J·查尼;S·陈努帕蒂;J·科巴尔;M·G·狄克逊;M·B·吉尔卡尔;J·C·霍尔;H·(S)·井户;P·拉赫纳;G·奈格;C·J·纽伯恩;R·S·帕塔萨拉蒂;B·L·托尔;R·瓦伦丁;J·G·维德迈尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 刘瑜,王英 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汇聚 散布 数据 元素 | ||
本申请是申请日为2010年12月22日、申请号为201010603703.5、发明名称为“汇聚和散布多个数据元素”的中国发明专利申请的分案申请。
技术领域
本公开涉及处理器领域。
背景技术
为了提高多媒体应用以及具有类似特性的其它应用的效率,已经在微处理器系统中实现了单指令多数据(SIMD)架构,以允许一条指令能够在多个操作数上并行操作。具体地说,SIMD架构利用了将许多数据元素打包在一个寄存器或连续的存储器单元内的优点。通过并行的硬件执行,由一条指令在不同的数据元素上执行多个操作,这通常会导致显著的性能优势。
在涉及不规则的存储器访问模式的应用中很难获得SIMD性能提升。例如,某些数据表需要频繁并随机地更新数据元素,所述数据元素可能或者可能没有存储在连续的存储器单元中,存储这种数据表的应用通常需要对数据进行重排列,以便充分地使用SIMD硬件。数据的这种重排列会导致大量的开销,因此限制了从SIMD硬件获得的效率。
随着SIMD向量宽度的增加(即,在其上执行单个操作的数据元素的数量),由于与重排列在非连续存储器存储设备中存储的数据元素相关联的开销,应用开发者(和编辑者)发现越来越难以充分使用SIMD硬件。
在附图和以下描述中阐述了本发明的一个或多个实施例的细节。根据说明书和附图以及根据权利要求,其它特征、目的和优势将变得显而易见。
附图说明
图1和图2是计算系统的示意性的说明。
图3是在处理器流水线中的阶段的框图。
图4是系统中的数据流的示意性的说明。
图5说明了在汇聚操作中的数据流的示例。
图6说明了在散布操作中的数据流的示例。
图7说明了用于打包/拆包以及辅助地址产生的有限状态机、和用于加载/存储的微码。
图8是用于动态汇聚/散布机制的示例性实现的流程图。
具体实施方式
汇聚和散布操作重排列所存储的数据元素以供SIMD硬件使用。汇聚操作从存储器读取一组数据元素并且将它们打包在一起,通常将它们打包到单个寄存器或高速缓存行中。散布操作通过将打包数据结构中的数据元素散布到一组非连续的或随机的存储器单元来执行相反的操作。除了与访问一级或多级存储器相关联的延迟之外,在汇聚或散布操作期间的中断,例如由于反复的页故障(page fault),可能显著地增加与这些操作相关联的开销,这是因为由操作带来的任何进展通常在返回到操作的开始之前被丢弃。美国专利申请No.2009/0172364(其多个部分已并入本文)公开了汇聚、散布和预取的实现,当这些操作被中断时可以保存操作的状态。因此,当重新启动操作时,可以不需要重复整个操作。
根据第一方面,可以通过以下步骤来实现高效的数据传输操作:由处理器设备解码单个指令,该单个指令指定在第一存储单元和第二存储单元之间的针对多个数据元素的传输操作;发出所述单个指令以由处理器中的执行单元来执行;在所述单个指令的执行期间检测异常(exception)的发生;并且响应于所述异常,在传送所述异常之前,将未决(pending)的陷阱(trap)或者中断(interrupt)传送到异常处理器。
为了讨论以下实施例、实现和示例,使用了说明性的术语。对这种说明性的术语中的某些的定义如下。
计算机系统或数据处理设备或系统可以被理解为是指用于访问数据和/或通信的各种设备或系统中的任意一种。示例包括但并不限于一个或多个以下设备的任意组合:膝上型电脑、笔记本电脑;台式电脑、个人数字助理、手持电脑、个人管理器;掌上电脑、便携式电脑、手机/传真设备、游戏机、数字平板设备、电子书、和数字视频或数字音频记录器/播放器。
寄存器是能够存储并提供数据的任意设备。以下描述关于数据格式的寄存器的其它功能。寄存器不是必须与处理器包括在同一管芯上或者包括在相同的封装中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410401488.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:铁道车辆用转向架
- 下一篇:一种用于断路器的分合闸双稳态弹簧保持机构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置