[发明专利]用于融合乘法-乘法指令的装置和方法有效
申请号: | 201580064354.5 | 申请日: | 2015-11-24 |
公开(公告)号: | CN107003848B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | J·考博尔圣阿德里安;R·凡伦天;M·J·查尼;E·乌尔德-阿迈德-瓦尔;R·艾斯帕萨;G·索尔;M·费尔南德斯;B·希克曼 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 何焜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 融合 乘法 指令 装置 方法 | ||
1.一种处理器,包括:
解码单元,用于对单个指令进行解码,所述单个指令指定第一源操作数、第二源操作数、立即数值、以及目的地操作数,
第一源寄存器,所述第一源寄存器用于存储包括第一多个紧缩数据元素的所述第一源操作数;
第二源寄存器,所述第二源寄存器用于存储包括第二多个紧缩数据元素的所述第二源操作数;
第三源寄存器,所述第三源寄存器用于存储包括第三多个紧缩数据元素的第三源操作数,其中所述第三源寄存器由所述立即数值的多个位来标识;以及
融合乘法-乘法电路系统,用于执行经解码的所述单个指令以:
根据所述立即数值内的位位置中的对应值将所述第一、第二和第三源操作数的多个紧缩数据元素解释为正或负,
将所述第一多个紧缩数据元素中的对应数据元素乘以包括所述第二多个紧缩数据元素和所述第三多个紧缩数据元素的对应数据元素之积的第一结果数据元素以生成第二结果数据元素,以及
将所述第二结果数据元素存储在所述目的地操作数中。
2.如权利要求1所述的处理器,其特征在于,所述单个指令是单个融合乘法-乘法指令。
3.如权利要求2所述的处理器,其特征在于,所述解码单元用于将所述单个融合乘法-乘法指令解码为多个微操作。
4.如权利要求1所述的处理器,其特征在于,所述第一源操作数和所述目的地操作数是存储所述第二结果数据元素的单个寄存器。
5.如权利要求1所述的处理器,其特征在于,所述第二结果数据元素基于所述处理器的写掩码寄存器的值被写入所述目的地操作数。
6.如权利要求1所述的处理器,其特征在于,为了将所述多个紧缩数据元素解释为正或负,所述融合乘法-乘法电路系统用于读取所述立即数值的与所述第一多个紧缩数据元素相对应的第一位位置中的位值以判定所述第一多个紧缩数据元素为正还是为负,用于读取所述立即数值的与所述第二多个紧缩数据元素相对应的第二位位置中的位值以判定所述第二多个紧缩数据元素为正还是为负,并且用于读取所述立即数值的与所述第三多个紧缩数据元素相对应的第三位位置中的位值以判定所述第三多个紧缩数据元素为正还是为负。
7.如权利要求6所述的处理器,其特征在于,所述融合乘法-乘法电路系统进一步用于读取除了所述第一、第二和第三位位置中的所述位之外的一个或多个位的集合,以确定所述操作数中的至少一个操作数的寄存器或存储器位置。
8.一种用于指令处理的方法,包括:
将包括第一多个紧缩数据元素的第一源操作数存储在第一源寄存器中;
将包括第二多个紧缩数据元素的第二源操作数存储在第二源寄存器中;
将包括第三多个紧缩数据元素的第三源操作数存储在第三源寄存器中;
对单个指令进行解码,所述单个指令指定第一源操作数、第二源操作数、立即数值、以及目的地操作数,
根据所述立即数值内的位位置中的对应值将所述第一、第二和第三源操作数的多个紧缩数据元素解释为正或负;以及
将所述第一多个紧缩数据元素中的对应数据元素乘以包括所述第二多个紧缩数据元素和所述第三多个紧缩数据元素的对应数据元素之积的第一结果数据元素从而生成第二结果数据元素,并且将所述第二结果数据元素存储在所述目的地操作数中。
9.如权利要求8所述的方法,其特征在于,所述单个指令被解码为多个微操作。
10.如权利要求8所述的方法,其特征在于,所述第一源操作数和所述目的地操作数是存储所述第二结果数据元素的单个寄存器。
11.如权利要求8所述的方法,其特征在于,所述第二结果数据元素基于处理器的写掩码寄存器的值被写入所述目的地操作数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580064354.5/1.html,转载请声明来源钻瓜专利网。