[发明专利]用于对向量元素集合执行约减操作的方法和设备有效
申请号: | 201580063820.8 | 申请日: | 2015-11-23 |
公开(公告)号: | CN107003843B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | D.M.孔兹曼;C.J.休格斯 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李啸;付曼 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 向量 元素 集合 执行 操作 方法 设备 | ||
1.一种处理器,包括:
值向量寄存器,存储要约减的多个数据元素值;
索引向量寄存器,存储多个索引值,所述索引值指示所述值向量寄存器中的哪些值相互关联;
单指令多数据SIMD约减逻辑,通过组合来自所述值向量寄存器的数据元素值来对所述值向量寄存器内的所述数据元素值执行约减操作,所述数据元素值如由所述索引向量寄存器中的所述索引值所指示的那样相互关联;以及
累加向量寄存器,存储由所述SIMD约减逻辑生成的所述约减操作的结果。
2.根据权利要求1所述的处理器,其中为执行所述约减操作,所述SIMD约减逻辑要确定具有相同索引值的数据元素值群组并且要组合具有相同索引值的所述数据元素以生成多个结果,所述多个结果的每个结果包括共享相同索引值的数据元素值群组的算术组合。
3.根据权利要求2所述的处理器,其中所述SIMD约减逻辑要将每个结果存储在所述累加向量寄存器的指定的数据元素位置内。
4.根据权利要求3所述的处理器,其中所述SIMD约减逻辑要通过对共享相同索引值的元素值执行多个组合迭代来执行所述约减操作,所述组合迭代中的每个组合数据元素值对,直到在最终迭代中达到最终结果。
5.根据权利要求3所述的处理器,其中所述累加向量寄存器中的每个指定的数据元素位置包括与具有相对于所述索引向量寄存器中相同索引值的其它位置的最高有效位置的关联索引值的位置对应的位置;或者包括与具有相对于所述索引向量寄存器中的相同索引值的其它位置的最低有效位置的关联索引值的位置对应的位置。
6.根据权利要求1所述的处理器,其中所述值向量寄存器内的所述数据元素值的每个与所述处理器中的SIMD通道关联,并且其中执行所述约减操作还包括:
跨所述通道的每个计算冲突以生成冲突结果,并将所述冲突结果存储在冲突目的地寄存器中。
7.根据权利要求6所述的处理器,其中执行所述约减操作还包括:
将具有相同索引值的每个通道标记为在其相应的约减树中的左子项和右子项,以生成位序列。
8.根据权利要求7所述的处理器,其中执行所述约减操作还包括:
使用所述位序列作为掩码,所述掩码将所述左子项标记为活动或其将所述右子项标记为活动。
9.根据权利要求8所述的处理器,其中所述约减操作还包括对于每个通道,计算最高有效1的位索引,其指示如果所述掩码将所述左子项标记为活动,则最左边通道具有与右边相等的索引值,或者其指示如果所述掩码将所述右子项标记为活动,则最右边通道具有与左边相等的索引值。
10.根据权利要求9所述的处理器,其中所述约减操作还包括:如果所述掩码将所述左子项标记为活动,则将右子项移动成与左子项对齐,或者如果所述掩码将所述右子项标记为活动,则将左子项移动成与右子项对齐,以生成临时结果以及将所述临时结果放置在临时位置中。
11.根据权利要求10所述的处理器,还包括将约减操作应用于具有原始数据的所述临时结果以组合左和右子项来生成新结果,并且如果所述掩码将所述左子项标记为活动,则将所述新结果放置在与所述左子项关联的所述通道中,或者如果所述掩码将所述右子项标记为活动,则将所述新结果放置在与所述右子项关联的所述通道中。
12.根据权利要求10所述的处理器,其中执行所述约减操作还包括:
如果所述掩码将所述左子项标记为活动,则执行所述掩码和所述冲突结果的逐位与操作,由此清除与一个或多个右子项关联的所述冲突目的地寄存器中的位,并且在未来迭代中除去对那些右子项的考虑,或者如果所述掩码将所述右子项标记为活动,则执行所述掩码和所述冲突结果的逐位与操作,由此清除与一个或多个左子项关联的所述冲突目的地寄存器中的位,并且在未来迭代中除去对那些左子项的考虑。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580063820.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:浓缩的低粘度的鼠李糖脂组合物
- 下一篇:具有非可读页的存储器保护