[发明专利]模数加法指令在审
申请号: | 202211158890.X | 申请日: | 2022-09-22 |
公开(公告)号: | CN116069390A | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | F·伯默;V·戈帕尔;G·赛义夫;S·金;J·克劳福德 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F21/60 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 李炜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 加法 指令 | ||
1.一种处理器,包括:
第一电路系统,用于将指令解码为经解码的指令,所述指令用于指示第一源操作对象、第二源操作对象、第三源操作对象和目的地操作对象;以及
第二电路系统,包括用于执行所述经解码的指令的处理资源,其中,响应于所述经解码的指令,所述处理资源配置成用于:
将第一源操作对象数据的第一整数元素与第二源操作对象数据的第二整数元素相加,以生成中间值;
确定所述中间值是否大于或等于第三源操作对象数据的第三整数数据元素;
响应于由所述处理资源确定了所述中间值大于或等于所述第三整数数据元素,向由所述目的地操作对象指定的位置输出所述中间值减所述第三整数数据元素的结果;以及
否则,向由所述目的地操作对象指定的所述位置输出所述中间值。
2.如权利要求1所述的处理器,其中,所述处理资源配置成用于经由多个并行执行通道执行所述经解码的指令,并且所述第一整数元素、所述第二整数元素和所述第三整数元素与所述多个并行执行通道中的第一执行通道相关联。
3.如权利要求2所述的处理器,其中,所述处理资源配置成用于经由所述第一执行通道执行以下操作:
将所述第一整数元素与所述第三整数元素进行比较,并将所述第二整数元素与所述第三整数元素进行比较;以及
响应于确定了所述第一整数元素或所述第二整数元素大于或等于所述第三整数元素,对比特掩码中的比特置位,其中,在所述比特掩码的、与所述第一并行执行通道对应的位置中对所述比特置位。
4.如权利要求3所述的处理器,其中,所述第一源操作对象数据和所述第二源操作对象数据按照包括多个数据元素的紧缩数据类型,并且所述多个数据元素内的每个数据元素位置与所述多个并行执行通道中的相应的并行执行通道相关联。
5.如权利要求4所述的处理器,其中,所述第三源操作对象数据按照包括多个数据元素的紧缩数据类型,并且所述多个数据元素内的每个数据元素位置与所述多个并行执行通道中的相应的并行执行通道相关联。
6.如权利要求4所述的处理器,其中,所述第三源操作对象数据包括单个数据元素,并且所述单个数据元素与所述多个并行执行通道中的每个并行执行通道相关联。
7.如权利要求4-6中的任一项所述的处理器,还包括寄存器堆,所述寄存器堆具有多个不同宽度的寄存器,其中,所述目的地操作对象、所述第一源操作对象、所述第二源操作对象和所述第三源操作对象各自指定所述寄存器堆内的寄存器。
8.如权利要求7所述的处理器,其中,所述目的地操作对象用于指定128比特寄存器、256比特寄存器或512比特寄存器,并且所述处理资源用于按照包括多个数据元素的紧缩数据类型向所述目的地输出所述结果。
9.如权利要求1所述的处理器,其中,所述第一源操作对象数据和所述第二源操作对象数据包括多个32比特整数数据元素,并且所述第三源操作对象数据包括至少一个32比特数据元素。
10.如权利要求1-9中的任一项所述的处理器,其中,所述第一源操作对象数据和所述第二源操作对象数据包括多个64比特整数数据元素,并且所述第三源操作对象数据包括至少一个64比特数据元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211158890.X/1.html,转载请声明来源钻瓜专利网。