[发明专利]具有分离串行模块的处理器阵列无效
申请号: | 200680032447.0 | 申请日: | 2006-09-04 |
公开(公告)号: | CN101258480A | 公开(公告)日: | 2008-09-03 |
发明(设计)人: | R·P·克莱霍斯特;A·A·阿博;V·乔德哈里 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司 |
主分类号: | G06F15/80 | 分类号: | G06F15/80 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 李亚非;谭祐祥 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 分离 串行 模块 处理器 阵列 | ||
本发明涉及处理器阵列,尤其但不排他地涉及具有分离串行模块的单指令多数据(SIMD)数据处理器阵列,尤其但不排他地涉及查询表(LUT)模块,还涉及处理器阵列的操作方法和用于操作该处理器阵列的计算机程序。
在SIMD处理阵列中,多个处理元件(PE)的每一个都接收来自共同指令流的相同指令,并基于对该处理元件唯一的数据来执行该指令,其中该数据可以被称为本地数据(local data)。这种处理阵列适用于高度重复性的任务,即同时在多个数据项上实施同样的操作,这例如会发生在图像处理领域。
图1示出了经典的SIMD阵列,其具有多个处理元件2和一个由各元件共享的存储器4。指令输入6并行地为所有处理元件提供指令,也就是说所有元件执行同样的指令。然而这些元件确实是并行地存取存储器4中的不同数据。
然而,当处理操作依赖于数据,例如当执行查询表操作时,SIMD处理阵列并不是特别高效。在这种情况下,如果查询表被存储在存储器4中,那么每个处理器需要同时存取该存储器的不同部分,这样由于试图顺序存取而降低了性能。因此,在某些体系结构中,特别是在SIMD体系结构中,查询表操作在功能上计算,其可能需要非常大量的指令。
解决这一问题的一种方法在US6,665,768(Redford)中有所描述。在该方法中,一个内存条(memory bank)由多个处理器进行存取。然而,这样做的缺点是查询表的多个副本被存储在多个内存条中。这多个内存条可以由处理元件并行地存取。每个处理元件具有能够选择其中一个内存条的识别值,因此提高了速度。
WO2005/017765(Philips)中描述了一种改进的处理查询表的处理阵列。这种处理阵列的简化版以简化的形式示于图2。每个处理元件2都具有算术逻辑单元10和多个专用于该处理元件2的存储元件12。处理元件具有系数输入14和共同的指令输入6,以及内部累加器16。每个处理元件还包括各种多路复用器和算术逻辑单元,为了简洁起见从图2中将其省略。
可以通过在指令输入上提供适当的指令以及在系数输入上提供索引以便将累加器中的数据存储在由系数输入14索引的存储元件中,从而将数据项存储在处理元件2的其中一个存储元件12上。相反地,能够将数据从由系数输入索引的存储元件载入到累加器中。来自由系数输入14索引的存储元件12的数据还能够与累加器16中数据相乘。
WO2005/017765中描述了将正确数据载入用于查询表操作的存储元件中的多种可替换方式。在数据被载入之后,累加器16中的数据可被用作索引,以便选择其中一个存储元件并将存储在相应存储元件中的数据直接输出或者输出到内部寄存器。
因此,WO2005/017765中的处理阵列能够以三种方式运行。第一,就普通的阵列器件而言,每个处理元件都能够基于广播指令,在本地数据上执行同样的指令。第二,每个处理元件都能够在本地数据上执行同样的指令,但是在系数输入上提供不同的系数。第三,每个处理元件都能够执行查询表中确定的功能。WO2005/017765中的处理阵列因此能够提供如下优点,SIMD处理在依赖于数据的处理操作中性能得到改善。
然而,按照图2所示的配置为每个处理元件提供本地存储器与按照图1所示配置的跨越更多处理器的普通宽存储器相比,需要多得多的硅面积(silicon area)。并且,这样增加的复杂度需要在每个处理元件中有更多的开销(overhead),诸如地址解码器。
这种复杂度意味着利用间接寻址的SIMD器件可能会相当昂贵。
并且,在并行查询表操作的特定情况下,需要将查询表存储在每个处理元件的存储器中。实际上,不可能为了能够存储大的查询表而为每个处理元件提供足够的存储位置。
对于添加到并行处理阵列上的其它类型的附加处理也可能发生同样的问题。
因此,仍然需要改进的用于提供附加功能的并行处理阵列。
根据本发明,提供了一种处理器阵列,包括:
多个处理器元件,用于并行处理数据行;
可由多个处理器元件并行存取的存储器;
具有串行输入和输出的串行模块,用于对在串行输入上输入的数据行实施处理操作以便修改数据行,并且在串行输出上输出结果作为修改的数据行;和
用于从处理器元件和存储器向串行模块串行输入串行地提供数据行,以及在处理操作之后将修改的数据行从串行输出返回到处理器元件和存储器的装置。
该串行模块可以是查询表模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司,未经皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680032447.0/2.html,转载请声明来源钻瓜专利网。