[发明专利]用于重新出现的相邻聚集的指令和逻辑在审
申请号: | 201680067704.8 | 申请日: | 2016-11-18 |
公开(公告)号: | CN108292229A | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | E·乌尔德-阿迈德-瓦尔;N·阿斯塔菲耶夫 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F9/30;G06F15/80;G06F9/345 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 何焜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 高速缓存 高速缓存行 存储器 寄存器 指令 逻辑处理器 解码指令 元素计算 指令分配 分配器 加载 取出 | ||
1.一种处理器,包括:
前端,用于解码指令,所述指令用于将分散的数据从存储器聚集到目的地寄存器中;
具有多个高速缓存行的高速缓存;
执行单元;以及
分配器,用于将所述指令分配给所述执行单元以执行所述指令;
其中所述执行单元包括:
元素计数,包括第一逻辑,由要聚集在所述目的地寄存器中的元素的数量定义;
第二逻辑,用于为所述目的地寄存器的元素计算在所述存储器中的地址;
第三逻辑,用于基于所述地址的至少一个高速缓存行不驻留在所述高速缓存中的确定,将所述至少一个高速缓存行取出到所述高速缓存中;以及
第四逻辑,用于从所述高速缓存行加载所述目的地寄存器的所述元素。
2.如权利要求1所述的处理器,其特征在于,所述执行单元进一步包括:
第五逻辑,用于从用于聚集分散的数据的先前指令检测匹配的置换模式;以及
第六逻辑,用于基于检测到所述匹配的置换模式直接地从所述高速缓存加载所述目的地寄存器。
3.如权利要求1所述的处理器,其特征在于,所述执行单元进一步包括:第五逻辑,用于至少基于提示确定要取出的高速缓存行的数量,所述提示指示具有置换模式的后续聚集的数量,其中所述置换模式用来在所述后续聚集与所述指令之间共享。
4.如权利要求1所述的处理器,其特征在于,所述执行单元进一步包括:第五逻辑,用于将对应于取出的高速缓存行的结构阵列转置为阵列结构以用于加载到所述目的地寄存器中。
5.如权利要求3所述的处理器,其特征在于,所述执行单元进一步包括:第六逻辑,用于基于存储器中的计算的地址与具有所述置换模式的先前聚集的先前计算的地址之间的距离确定跨度,并且所述第五逻辑进一步用于基于所述跨度来确定要取出的高速缓存行的数量。
6.如权利要求1所述的处理器,其特征在于,位于所述存储器中的所述地址处的所述分散的数据具有用于要聚集在所述目的地寄存器中的多个元素的相同基址。
7.如权利要求1所述的处理器,其特征在于,位于存储器中的所述地址处的所述分散的数据具有用于要聚集在所述目的地寄存器中的多个元素的相同索引。
8.一种方法,包括:
确定要聚集的目的地寄存器的元素的数量;
为至少一个元素计算在存储器中的地址;
确定所述地址是否驻留在高速缓存中;
基于所述地址不驻留在所述高速缓存中的确定,将所述地址的至少一个高速缓存行取出到所述高速缓存中;以及
从所述高速缓存行加载所述目的地寄存器的至少一个元素。
9.如权利要求8所述的方法,其特征在于,进一步包括:
从先前聚集检测匹配的置换模式;以及
基于检测到所述匹配的置换模式,直接地从所述高速缓存加载所述目的地寄存器。
10.如权利要求8所述的方法,其特征在于,进一步包括:至少基于提示来确定要取出的高速缓存行的数量,所述提示指示具有与所述地址处的数据的置换模式相同的后续置换模式的后续聚集的数量。
11.如权利要求8所述的方法,其特征在于,进一步包括:将取出的高速缓存行从结构阵列转置为阵列结构以用于加载到所述目的地寄存器中。
12.如权利要求10所述的方法,其特征在于,进一步包括:基于存储器中的计算的地址与具有所述置换模式的先前聚集的先前计算的地址之间的距离确定跨度,并且确定要取出的高速缓存行的数量的步骤进一步基于所述跨度。
13.如权利要求8所述的方法,其特征在于,进一步包括:确定所述地址处的数据具有用于要聚集在所述目的地寄存器中的多个元素的相同索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680067704.8/1.html,转载请声明来源钻瓜专利网。