[发明专利]使用写掩码将两个源操作数混合进单个目的地的系统、装置和方法在审
申请号: | 201811288381.2 | 申请日: | 2011-12-12 |
公开(公告)号: | CN109471659A | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | J·C·三额詹;B·L·托尔;R·C·凡伦天;J·G·韦德梅耶;S·萨姆德若拉;M·B·吉尔卡尔;A·T·福塞斯;E·乌尔德-阿迈德-瓦尔;D·R·布拉德福德;L·K·吴 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 张欣;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据元素 源操作数 掩码 相对应位置 混合指令 操作数 位位置 选择器 存储 | ||
公开了使用写掩码将两个源操作数混合进单个目的地的系统、装置和方法。在一些实施例中,混合指令的执行导致使用写掩码的相对应位位置作为第一和第二操作数之间的选择器来进行对第一和第二源操作数的数据元素的逐数据元素的选择,及将所选择的数据元素在目的地的相对应位置处存储进目的地。
本申请是题为“使用写掩码将两个源操作数混合进单个目的地的系统、装置和方法”的发明专利申请201611035320.6的分案申请。专利申请201611035320.6是国际申请日为2011年12月12日,国际申请号为PCT/US2011/064486,中国国家阶段申请号为201180069936.4的发明专利申请的分案申请。
技术领域
本发明的领域一般涉及计算机处理器架构,以及更具体地涉及当被执行时导致特定结果的指令。
背景技术
基于控制流信息合并来自向量源的数据是基于向量的架构的普遍问题。例如,为了将以下代码向量化,需要:1)生成指示a[i]>0是否为真的布尔向量的方法和2)基于该布尔向量从两个源(A[i]或B[i])中选择任一值并将内容写入不同目的地(C[i])的方法。
附图说明
作为示例而非限制,在附图中示出了本发明,附图中相似的附图标记指示相似的元素,附图中:
图1示出了混合指令执行的示例。
图2示出了混合指令执行的另一个示例。
图3示出了混合指令的伪代码的示例。
图4示出了在处理器中使用混合指令的实施例。
图5示出了用于处理混合指令的方法的实施例。
图6示出了用于处理混合指令的方法的实施例。
图7A是示出根据本发明实施例的通用向量友好指令格式和其A类指令模板的框图。
图7B是示出根据本发明实施例的通用向量友好指令格式和其B类指令模板的框图。
图8A-C示出了根据本发明实施例的示例性特定向量友好指令格式。
图9是根据本发明一实施例的寄存器架构的框图。
图10A是根据本发明实施例的单个CPU核以及它与管芯上互连网络的连接和它的2级(L2)高速缓存本地子集的框图。
图10B是根据本发明实施例的图10A中的CPU核的一部分的分解图。
图11是示出根据本发明实施例的示例性乱序架构的框图。
图12是根据本发明一实施例的系统的框图。
图13是根据本发明实施例的第二系统的框图。
图14是根据本发明实施例的第三系统的框图。
图15是根据本发明实施例的SoC的框图。
图16是根据本发明实施例的具有集成存储器控制器和图形器件的单核处理器和多核处理器的框图。
图17是对比根据本发明实施例使用软件指令转换器将源指令集的二进制指令转换成目标指令集的二进制指令的框图。
具体实施方式
在以下描述中阐述了众多具体细节。然而应理解,可以在没有这些具体细节的情况下实践本发明的实施例。在其它实例中,为了不妨碍对本描述的理解,没有详细示出公知的电路、结构和技术。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811288381.2/2.html,转载请声明来源钻瓜专利网。