[发明专利]合并相邻的聚集/分散操作有效
申请号: | 201280076796.8 | 申请日: | 2012-12-26 |
公开(公告)号: | CN104756068B | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | A·T·福塞斯;B·J·希克曼;J·C·豪尔;C·J·休斯 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/06 | 分类号: | G06F9/06;G06F9/30;G06F13/14 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 毛力 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 合并 相邻 聚集 分散 操作 | ||
1.一种处理器,包括:
指令解码器,用于对第一指令进行解码,所述第一指令用于聚集来自存储器的数据元素,所述第一指令具有用于指定第一存储位置的第一操作数和用于指示用来存储多个数据元素的第一存储器地址的第二操作数;
执行单元,耦合至所述指令解码器,响应于所述第一指令,所述执行单元用于:基于应由所述第二操作数指示的所述第一存储器地址,从存储器位置中读取所述数据元素中连续的第一数据元素和第二数据元素;并且将所述第一数据元素存储在所述第一存储位置的第一条目中,将所述第二数据元素存储在第二存储位置的第二条目中,该第二条目对应于所述第一存储位置的所述第一条目的。
2.如权利要求1所述的处理器,其特征在于,所述第一指令进一步包括用于指定所述第二存储位置的第三操作数。
3.如权利要求1所述的处理器,其特征在于,所述指令解码器用于进一步对第二指令进行解码,所述第二指令具有用于指定所述第二存储位置的第三操作数和用于指定第二存储器地址的第四操作数,所述第二存储器地址应从所述第一存储器地址偏移所述第一数据元素的尺寸。
4.如权利要求3所述的处理器,其特征在于,所述第一指令进一步包括前缀,所述前缀向所述指令解码器和所述执行单元指示所述第二指令跟随所述第一指令。
5.如权利要求3所述的处理器,其特征在于,所述执行单元用于预测所述第二指令跟随所述第一指令。
6.如权利要求1所述的处理器,其特征在于,所述第一存储位置的所述第一条目与所述第二存储位置的第二条目是不连续的,并且其中,由所述第一操作数来指定所述第二存储位置。
7.如权利要求1所述的处理器,其特征在于,在将所述第一数据元素存储在所述第一存储位置的所述第一条目中之前,所述第一数据元素应存储在第三存储位置的第三条目中,并且在将所述第二数据元素存储在所述第二存储位置的所述第二条目中之前,所述第二数据元素应存储在第四存储位置的第四条目中。
8.一种指令处理方法,包括:
对第一指令进行解码,所述第一指令用于聚集来自存储器的数据元素,所述第一指令具有指定第一存储位置的第一操作数和指示存储多个数据元素的第一存储器地址的第二操作数;
响应于所述第一指令,基于由所述第二操作数指示的所述第一存储器地址,从存储器位置中读取所述数据元素中连续的第一数据元素和第二数据元素;以及
将所述第一数据元素存储在所述第一存储位置的第一条目中,并且将所述第二数据元素存储在第二存储位置的第二条目中,该第二条目对应于所述第一存储位置的所述第一条目。
9.如权利要求8所述的指令处理方法,其特征在于,所述第一指令进一步包括指定所述第二存储位置的第三操作数。
10.如权利要求8所述的指令处理方法,其特征在于,还包括对第二指令进行解码,所述第二指令具有指定所述第二存储位置的第三操作数和指定第二存储器地址的第四操作数,所述第二存储器地址从所述第一存储器地址偏移所述第一数据元素的尺寸。
11.如权利要求10所述的指令处理方法,其特征在于,所述第一指令进一步包括前缀,所述前缀向指令解码器和执行单元指示所述第二指令跟随所述第一指令。
12.如权利要求10所述的指令处理方法,其特征在于,执行单元预测所述第二指令跟随所述第一指令。
13.如权利要求8所述的指令处理方法,其特征在于,所述第一存储位置的所述第一条目与所述第二存储位置的第二条目是不连续的,并且其中,由所述第一操作数指定所述第二存储位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280076796.8/1.html,转载请声明来源钻瓜专利网。