[发明专利]在基于矢量处理器的设备中提供对处理元件(PE)的可重构融合在审
申请号: | 201980045093.0 | 申请日: | 2019-06-25 |
公开(公告)号: | CN112470120A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | H·帕兰德赫·阿夫沙尔;A·潘达;E·罗滕贝格;G·M·赖特 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;傅远 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 矢量 处理器 设备 提供 处理 元件 pe 可重构 融合 | ||
公开了在基于矢量处理器的设备中提供对处理元件(PE)的可重构融合。就这点而言,基于矢量处理器的设备提供了包括多个PE和解码/控制电路的矢量处理器。解码/控制电路接收指令块,该指令块包含可矢量化循环,该可矢量化循环包括循环本体。解码/控制电路确定该多个PE中的多少个PE是执行循环本体所需的,并且将多个PE重新配置为一个或多个融合PE,每个融合PE包括所确定的、执行循环本体所需的数目个PE。然后,被重新配置为一个或多个融合PE的多个PE执行循环本体的一个或多个循环迭代。一些方面还包括PE通信链路,其互连多个PE,以使得能够在融合PE的PE之间进行通信并且在PE之间进行迭代间数据相关性的通信,而无需矢量寄存器文件访问操作。
本专利申请要求于2018年7月5日提交的题为“在基于矢量处理器的设备中提供对处理元件(PE)的可重构融合”的美国非临时专利申请号16/028,072的优先权,该美国非临时专利申请转让给本受让人并且其全部内容在此通过引用明确并入本文。
技术领域
本公开的技术一般涉及基于矢量处理器的设备,具体涉及使用基于矢量处理器的设备的处理元件(PE)对可矢量化循环进行并行处理。
背景技术
基于矢量处理器的设备是采用能够使用单个程序指令对数据(“矢量”)的一维阵列进行操作的矢量处理器的计算设备。传统矢量处理器包括被组织为矢量通道的多个处理元件(PE),每个矢量通道可以彼此并行执行计算。作为非限制性示例,传统矢量处理器所提供的PE中的每个PE可以为有序处理单元,或可以是可重构构造,诸如包括功能单元的可编程互连组的粗粒度可重构阵列(CGRA)。基于矢量处理器的设备对于处理涉及高度数据级并行性(DLP)的可矢量化循环特别有用。
当对可矢量化循环进行处理时,矢量处理器的每个PE可以并行执行相同的任务(例如,使用可矢量化循环的感应变量的不同值来执行可矢量化循环的相同循环本体)。当使用具有可重构PE的传统矢量处理器(例如,其中每个PE为CGRA的矢量处理器)对可矢量化循环进行处理时,矢量处理器的性能在很大程度上取决于可矢量化循环的循环本体如何被映射到PE。在理想场景中,对矢量处理器的PE进行配置一次,然后每个PE对可矢量化循环的一个循环迭代进行并行处理,直到执行完所有循环迭代为止。然而,实际上,在一些情况下,可矢量化循环的循环本体到矢量处理器的PE的映射可能会导致性能欠佳。例如,如果循环本体太大而无法由单个PE处理(例如,由于循环本体所需的操作比PE所提供的数目个功能单元所能执行的操作更多),则循环本体的每个循环迭代必须将其拆分为多个循环分区,并且在执行每个循环分区之后,必须动态重新配置PE。由于PE的重新配置以及需要经由矢量寄存器文件传达每个循环分区执行结果的需要,所以以这种方式拆分每个循环迭代会导致矢量处理器遭受性能损失。而且,如果循环迭代的数目小于PE的数目,则数个其他可用PE将会被弃之不用。最后,在其中循环迭代之间存在数据相关性的可矢量化循环的情况下,必须经由矢量寄存器文件将数据相关性从一个循环迭代传递到另一循环迭代,从而导致计算昂贵。
发明内容
具体实施方式中所公开的各个方面包括在基于矢量处理器的设备中提供对处理元件(PE)的可重构融合。就这点而言,基于矢量处理器的设备提供了一种矢量处理器,该矢量处理器包括多个PE和解码/控制电路,该解码/控制电路被配置为根据需要将多个PE分组为更大的“融合”PE。一些方面还包括一种PE通信链路,该PE通信链路互连多个PE,以使得能够在融合PE之间以及包括融合PE的PE之中进行通信,而无需矢量寄存器文件访问操作。在示例性操作中,解码/控制电路接收指令块,该指令块包含可矢量化循环,该可矢量化循环包括循环本体。解码/控制电路确定需要多个PE中的多少个PE来执行循环本体(例如,基于将循环本体内的数个指令与每个PE所提供的数个功能单元进行比较)。然后,解码/控制电路将多个PE重新配置为一个或多个融合PE,每个融合PE包括所确定的、执行循环本体所需的数目个PE。因此,然后,被重新配置为一个或多个融合PE的多个PE执行循环本体的一个或多个循环迭代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980045093.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:制备水性聚合物分散体的方法
- 下一篇:用于多点通信的反馈