[发明专利]BFLOAT16平方根和/或平方根倒数指令在审
申请号: | 202210908969.3 | 申请日: | 2022-07-29 |
公开(公告)号: | CN115729620A | 公开(公告)日: | 2023-03-03 |
发明(设计)人: | M·阿德尔曼;A·海内克;R·凡伦天;Z·斯波伯;A·格雷德斯廷;M·查尼;E·吉奥加纳斯;D·卡拉姆卡;C·休斯;C·安德森 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38;G06F7/483 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 任曼怡;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | bfloat16 平方根 倒数 指令 | ||
1.一种装置,包括:
解码电路,用于对单个指令的实例进行解码,所述单个指令包括用于以下各项的字段:操作码、紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的标识,其中,所述操作码用于指示出执行电路要进行:针对所述紧缩数据源操作对象的每个数据元素位置执行所述位置中的BF16数据元素的平方根值的计算,以及将每个平方根的结果存储到所述紧缩数据目的地操作对象的对应数据元素位置中;以及
所述执行电路,用于根据所述操作码来执行经解码的指令。
2.如权利要求1所述的装置,其中,用于第一源操作对象的标识的字段用于标识向量寄存器。
3.如权利要求1所述的装置,其中,用于第一源操作对象的标识的字段用于标识存储器位置。
4.如权利要求1所述的装置,其中,所述执行电路用于在经解码的指令的执行期间将非正规数据元素视为零。
5.如权利要求1所述的装置,其中,所述执行电路用于在经解码的指令的执行期间抑制数值标志。
6.如权利要求1所述的装置,其中,所述指令进一步包括用于写入掩码寄存器的一个或多个字段。
7.如权利要求1所述的装置,其中,所述指令进一步包括用于谓词寄存器的一个或多个字段。
8.一种系统,包括:
存储器,用于存储单个指令的实例;
解码电路,用于对所述单个指令的所述实例进行解码,所述单个指令包括用于以下各项的字段:操作码、紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的标识,其中,所述操作码用于指示出执行电路要进行:针对所述紧缩数据源操作对象的每个数据元素位置执行所述位置中的BF16数据元素的平方根值的计算,以及将每个平方根的结果存储到所述紧缩数据目的地操作对象的对应数据元素位置中;以及
所述执行电路,用于根据所述操作码来执行经解码的指令。
9.如权利要求8所述的系统,其中,用于第一源操作对象的标识的字段用于标识向量寄存器。
10.如权利要求8所述的系统,其中,用于第一源操作对象的标识的字段用于标识存储器位置。
11.如权利要求8-10中任一项所述的系统,其中,所述执行电路用于在经解码的指令的执行期间将非正规数据元素视为零。
12.如权利要求8-11中任一项所述的系统,其中,所述执行电路用于在经解码的指令的执行期间抑制数值标志。
13.如权利要求8-12中任一项所述的系统,其中,所述指令进一步包括用于写入掩码寄存器的一个或多个字段。
14.如权利要求8-13中任一项所述的系统,其中,所述指令进一步包括用于谓词寄存器的一个或多个字段。
15.一种方法,包括:
对单个指令的实例进行解码,所述单个指令包括用于以下各项的字段:操作码、紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的标识,其中,所述操作码用于指示出执行电路要进行:针对所述紧缩数据源操作对象的每个数据元素位置执行所述位置中的BF16数据元素的平方根值的计算,以及将每个平方根的结果存储到所述紧缩数据目的地操作对象的对应数据元素位置中;以及
根据所述操作码执行经解码的指令。
16.如权利要求15所述的方法,其中,用于第一源操作对象的标识的字段用于标识向量寄存器。
17.如权利要求15所述的方法,其中,用于第一源操作对象的标识的字段用于标识存储器位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210908969.3/1.html,转载请声明来源钻瓜专利网。