[发明专利]BFLOAT16缩放和/或化简指令在审
申请号: | 202210866252.7 | 申请日: | 2022-07-22 |
公开(公告)号: | CN115729616A | 公开(公告)日: | 2023-03-03 |
发明(设计)人: | 梅纳赫姆·阿德尔曼;亚历山大·海涅克;罗伯特·瓦伦泰恩;泽夫·斯帕波;阿米特·格拉德斯坦;马克·查尼;伊万戈洛斯·乔治安娜;迪拉吉·卡拉姆卡尔;克里斯托弗·修斯;克里斯蒂娜·安德森 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 桑敏 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | bfloat16 缩放 指令 | ||
1.一种装置,包括:
解码设备,用于对单个指令的实例进行解码,所述单个指令包括用于以下各项的字段:操作码、第一紧缩数据源操作对象的位置的标识、第二紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的标识,其中,所述操作码用于指示执行设备要对于所述紧缩数据源操作对象的每个数据元素位置,通过将所述第一紧缩数据源操作对象的BF16数据元素乘以2的幂值来执行该数据元素的浮点缩放操作,其中,所述2的幂值的指数的值是所述第二紧缩数据源操作对象的BF16数据元素的向下取整值,并且将所述浮点缩放操作的结果存储到所述紧缩数据目的地操作对象的相应数据元素位置中;以及
所述执行设备,用于根据所述操作码来执行经解码的指令。
2.如权利要求1所述的装置,其中,用于所述第一紧缩数据源操作对象的位置的标识的字段用于标识向量寄存器。
3.如权利要求1所述的装置,其中,用于所述第一紧缩数据源操作对象的位置的标识的字段用于标识存储器位置。
4.如权利要求1所述的装置,其中,所述执行设备用于在所述经解码的指令的执行期间使用舍入到最接近的偶数舍入模式。
5.如权利要求1所述的装置,其中,当所述第二紧缩数据源操作对象的数据元素是非正规数时,所述向下取整值是零。
6.如权利要求1所述的装置,其中,当所述第一紧缩数据源操作对象的数据元素是非正规数时,所述第一紧缩数据源操作对象的数据元素是零。
7.如权利要求1所述的装置,其中,所述指令还包括用于写入掩码寄存器的一个或多个字段。
8.一种系统,包括:
存储器,用于存储单个指令的实例;
解码设备,用于对所述单个指令的实例进行解码,所述单个指令包括用于以下各项的字段:操作码、第一紧缩数据源操作对象的位置的标识、第二紧缩数据源操作对象的位置的标识、以及紧缩数据目的地操作对象的标识,其中,所述操作码用于指示执行设备要对于所述紧缩数据源操作对象的每个数据元素位置,通过将所述第一紧缩数据源操作对象的BF16数据元素乘以2的幂值来执行该数据元素的浮点缩放操作,其中,所述2的幂值的指数的值是所述第二紧缩数据源操作对象的BF16数据元素的向下取整值,并且将所述浮点缩放操作的结果存储到所述紧缩数据目的地操作对象的相应数据元素位置中;以及
所述执行设备,用于根据所述操作码来执行经解码的指令。
9.如权利要求8所述的系统,其中,用于所述第一紧缩数据源操作对象的位置的标识的字段用于标识向量寄存器。
10.如权利要求8所述的系统,其中,用于所述第一紧缩数据源操作对象的位置的标识的字段用于标识存储器位置。
11.如权利要求8所述的系统,其中,所述执行设备用于在所述经解码的指令的执行期间使用舍入到最接近的偶数舍入模式。
12.如权利要求8所述的系统,其中,当所述第二紧缩数据源操作对象的数据元素是非正规数时,所述向下取整值是零。
13.如权利要求8所述的系统,其中,所述指令还包括用于写入掩码寄存器的一个或多个字段。
14.如权利要求8所述的系统,其中,当所述第一紧缩数据源操作对象的数据元素是非正规数时,所述第一紧缩数据源操作对象的数据元素是零。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210866252.7/1.html,转载请声明来源钻瓜专利网。