[发明专利]用于执行向量扫描运算的数据处理设备和方法有效
申请号: | 201510089213.0 | 申请日: | 2015-02-27 |
公开(公告)号: | CN104899180B | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 马蒂亚斯·伯特歇尔;贾科莫·加布雷利;姆布·埃约勒-莫诺诺 | 申请(专利权)人: | ARM有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 李晓冬 |
地址: | 英国*** | 国省代码: | 英国;GB |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 公开了用于执行向量扫描运算的数据处理设备和方法。向量扫描运算被执行以产生结果向量的M个数据元素,其中每个结果数据元素对应于额外数据元素S与源向量操作数V的至少一些数据元素的组合。向量扫描运算被使用多个步骤执行,每个步骤包括用于组合数据元素的一个或多个组合运算。这些步骤中的至少一个步骤包括两个或多个并行执行的组合运算。这些步骤中的至少两个步骤包括用于组合数据元素与额外数据元素S的组合运算。该方法使得向量扫描运算在少于M个数据元素有效的情况下能够以更少的步骤被执行,从而使得向量扫描运算可以被更快地执行。 | ||
搜索关键词: | 用于 执行 向量 扫描 运算 数据处理 设备 方法 | ||
【主权项】:
1.一种数据处理设备,包括:向量寄存器存储器,该向量寄存器存储器被配置为存储包括多个数据元素的向量操作数;处理电路,该处理电路被配置为处理来自所述向量寄存器存储器的向量操作数;以及控制电路,该控制电路被配置为控制所述处理电路对源向量操作数的M个数据元素V[0]至V[M‑1]和至少一个额外数据元素S执行向量扫描运算,以产生结果向量操作数的M个数据元素R[0]至R[M‑1],其中,对于N≤M且0≤i<N,所述结果向量操作数的数据元素R[i]具有对应于所述至少一个额外数据元素S和所述源向量操作数的数据元素V[0]至V[i]中的至少一个数据元素的组合的值;其中,所述控制电路被配置为控制所述处理电路在多个步骤中执行所述向量扫描运算,每个步骤用于从第一向量产生第二向量,其中,用于第一步骤的第一向量包括所述源向量操作数的数据元素,并且用于其他步骤的第一向量包括在前步骤的第二向量,每个步骤包括用于组合所述第一向量的数据元素与所述至少一个额外数据元素S或所述第一向量的另一个数据元素以产生所述第二向量的数据元素的至少一个组合运算;所述多个步骤中的至少一个步骤包括并行执行的多个组合运算;并且所述多个步骤中的至少两个步骤包括用于组合所述第一向量的数据元素与所述至少一个额外数据元素S的组合运算;其中,M是2的幂;至少在N>G,M/2≤G<M的情况下,所述控制电路被配置为控制所述处理电路执行包括至少一个组合步骤和至少一个进一步步骤的所述多个步骤,所述至少一个组合步骤用于产生所述结果向量操作数的G个数据元素R[0]至R[G‑1],所述至少一个进一步步骤在除了所述至少一个组合步骤之外被额外执行时用于产生所述结果向量操作数的数据元素R[G]至R[M‑1];并且至少在N>G的情况下:所述至少一个组合步骤是这样的步骤:如果所述至少一个组合步骤是由所述处理电路在不执行所述至少一个进一步步骤的情况下执行的,则所述处理电路将在所述至少一个组合步骤的最后步骤产生所述第二向量的数据元素[G]至[M‑1],其中,对于G≤k<M,所述第二向量的数据元素[k]具有对应于所述源向量操作数的数据元素V[0]至V[k]中的至少一个数据元素的组合的值;并且在所述至少一个进一步步骤中,所述控制电路被配置为控制所述处理电路,对于G≤k<N,执行用于组合所述至少一个额外数据元素S与用于所述至少一个进一步步骤的所述第一向量的数据元素[k]的组合运算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于ARM有限公司,未经ARM有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510089213.0/,转载请声明来源钻瓜专利网。