[发明专利]矢量打包有符号值的相乘、求反和累加的系统、设备和方法在审
申请号: | 201811131786.5 | 申请日: | 2018-09-27 |
公开(公告)号: | CN109614144A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | V.R.马杜里;E.奥德-艾哈迈德-瓦尔;R.瓦伦丁;J.科巴尔;M.查尼 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 姜冰;杨美灵 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 打包数据 累加 求反 相乘 元素位置 操作数 解码 方法描述 源操作数 矢量 乘法 求和 处理器 打包 电路 存储 指令 | ||
1.一种用于执行指令的方法,所述方法包括:
由解码电路解码指令,所述指令具有用于第一和第二打包数据源操作数、和打包数据目的地操作数的字段;
通过以下操作由执行电路执行解码的指令:
将来自所述第一和第二打包数据源操作数中的多个打包数据元素位置的选择的数据值相乘,以生成多个第一结果值;
对所述多个第一结果值求和,以生成一个或多个第二结果值;
对所述一个或多个第二结果值求反,以生成一个或多个第三结果值;
累加所述一个或多个第三结果值,以生成一个或多个第四结果值;以及
在所述目的地操作数中的一个或多个打包数据元素位置中存储所述一个或多个第四结果值。
2.如权利要求1所述的方法,其中由所述解码电路执行所述解码的指令进一步包括将来自所述第一和第二打包数据源操作数中的所述多个打包数据元素位置的数据值复用到至少一个乘法器电路。
3.如权利要求2所述的方法,其中基于在所述第一和第二打包数据源操作数中共享相同打包数据元素位置的数据值,将来自所述第一和第二打包数据源操作数中的所述多个打包数据元素位置的所述数据值复用到所述至少一个乘法器电路。
4.如权利要求1所述的方法,其中所述一个或多个第二结果值由一个或多个加法器网络生成。
5.如权利要求1所述的方法,其中存储所述一个或多个第三结果值包括在所述打包数据目的地操作数的上半部分中存储结果值和在所述打包数据目的地操作数的下半部分中存储结果值。
6.如权利要求1所述的方法,其中所述将所述选择的数据值相乘包括:
执行运算S1H*S2H、S1G*S2G、S1F*S2F和S1E*S2E以及运算S1D*S2D、S1C*S2C、S1B*S2B和S1A*S2A,以生成所述多个第一结果值,
其中S1标识所述第一打包数据源操作数,S2标识所述第二打包数据源操作数,并且A、B、C、D、E、F、G和H标识在所述第一和第二打包数据源操作数中从最低到最高数据元素位置排序的所述打包数据元素位置。
7.如权利要求6所述的方法,其中对所述多个第一结果值求和包括执行运算(S1H*S2H)+(S1G*S2G)+(S1F*S2F)+(S1E*S2E)和执行运算(S1H*S2H)+(S1G*S2G)+(S1B*S2B)+(S1A*S2A),以生成所述一个或多个第二结果值。
8.如权利要求1所述的方法,进一步包括,响应于检测到所述一个或多个第三结果值的某个值高于阈值,在所述目的地操作数的对应位置中存储最大值。
9.一种设备,包括:
解码指令的解码器,所述指令具有用于第一和第二打包数据源操作数、和打包数据目的地操作数的字段;以及
执行电路,所述执行电路用于执行解码的指令以:
将来自所述第一和第二打包数据源操作数中的多个打包数据元素位置的选择的数据值相乘,以生成多个第一结果值;
对所述多个第一结果值求和,以生成一个或多个第二结果值;
对所述一个或多个第二结果值求反,以生成一个或多个第三结果值;
累加所述一个或多个第三结果值,以生成一个或多个第四结果值;以及
在所述目的地操作数中的一个或多个打包数据元素位置中存储所述一个或多个第四结果值。
10.如权利要求9所述的设备,其中由所述解码电路执行所述解码的指令进一步包括将来自所述第一和第二打包数据源操作数中的所述多个打包数据元素位置的数据值复用到至少一个乘法器电路。
11.如权利要求9所述的设备,其中基于在所述第一和第二打包数据源操作数中共享相同打包数据元素位置的数据值,将来自所述第一和第二打包数据源操作数中的所述多个打包数据元素位置的所述数据值复用到所述至少一个乘法器电路。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811131786.5/1.html,转载请声明来源钻瓜专利网。