[发明专利]用于具有可变精度输入操作数的融合乘-加操作的指令在审
申请号: | 201910148847.7 | 申请日: | 2019-02-28 |
公开(公告)号: | CN110321157A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | D·达斯;N·K·梅勒普迪;M·杜塔;A·库马;D·穆迪盖雷;A·孔杜 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 李炜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 所公开的实施例关于用于具有可变精度输入的融合乘‑加(FMA)操作的指令。在一个示例中,一种用于执行非对称FMA指令的处理器包括:取出电路,用于取出FMA指令,该FMA指令具有用于指定操作码、目的地以及分别具有第一宽度和第二宽度的第一源向量和第二源向量的字段;解码电路,用于对取出的FMA指令解码;以及单指令多数据(SIMD)执行电路,用于通过以下步骤来处理第二源向量的、与适配到SIMD通道宽度的数量一样多的元素:将每个元素乘以第一源向量的对应元素,并将所得到的乘积与目的地的先前内容累加,其中,SIMD通道宽度是16位、32位和64位中的一种,第一宽度是4位和8位中的一种,并且第二宽度是1位、2位和4位中的一种。 | ||
搜索关键词: | 源向量 指令 取出 可变 电路 单指令多数据 输入操作数 解码电路 指令解码 融合 操作码 非对称 累加 处理器 适配 字段 | ||
【主权项】:
1.一种用于执行非对称融合乘‑加FMA指令的处理器,所述处理器包括:取出电路,用于取出FMA指令,所述FMA指令具有用于指定操作码、目的地以及分别具有第一宽度和第二宽度的第一源向量和第二源向量的字段;解码电路,用于对取出的FMA指令解码;以及单指令多数据SIMD执行电路,用于执行经解码的FMA指令以通过以下步骤来处理所述第二源向量的、与适配到SIMD通道宽度的数量一样多的元素:将每个元素乘以所述第一源向量的对应元素,并将所得到的乘积与所述目的地的先前内容累加;其中,所述SIMD通道宽度是16位、32位和64位中的一种,所述第一宽度是4位和8位中的一种,并且所述第二宽度是1位、2位和4位中的一种。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910148847.7/,转载请声明来源钻瓜专利网。
- 上一篇:浏览器预置网站区域控制的方法
- 下一篇:用于处理高效多播操作的装置和方法