[发明专利]一种基于SRAM的矩阵转置的装置及方法有效
申请号: | 201310367449.7 | 申请日: | 2013-08-21 |
公开(公告)号: | CN103389967A | 公开(公告)日: | 2013-11-13 |
发明(设计)人: | 胡封林;郭阳;刘仲;吴虎成;李振涛;罗恒;余再祥;亓磊;申晖 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F13/16 |
代理公司: | 湖南兆弘专利事务所 43008 | 代理人: | 周长清 |
地址: | 410073 湖南省长沙市砚瓦池正*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 sram 矩阵 装置 方法 | ||
技术领域
本发明涉及矩阵转置数据处理领域,特别地,涉及一种基于SRAM的矩阵转置的装置及方法。
背景技术
矩阵转置(Matrix Transposing)在科学计算中应用广泛,例如应用于矩阵分解、线性代数求解、3G通信算法、图像视频算法、雷达、水声算法等科学与工程计算中。对于一个n×n阶(n>1)源矩阵A=[aij],将其每一下三角元素aij(i>j)沿主对角线与其对称元素aji互换就构成了转置矩阵AT[bij]。公式(1)给出了转置矩阵AT[bij]与源矩阵A[aij]的每一个矩阵元素对应关系:
bji=aij(i=0,1,…,n-1;j=0,1,…,n-1) (1)
快速高效的矩阵转置方法和装置的应用将极大地提高各种系统的性能和效率,过去的时间里,人们发明了各种基于软件和硬件的矩阵转置方法,也得到了广泛的应用。
软件方法方面,最简单的方法是以主对角线为轴,一次交换一对数据,对于一个n×n阶矩阵,其时间开销为O(n(n-1)/2),效率较低。Eklundh提出一种快速的矩阵转置算法,该算法完全独立于硬件结构,是基于divide-and-conquer策略的,时间开销为O(nlogn),其缺点是对于一个n×n阶矩阵,n必须是2的整次幂,且实时性差。PRIM提出一种算法,克服了n必须是2的整次幂的限制,其时间开销与Eklundh算法相同。针对向量处理器,有人提出用Eklundh算法在SIMD上进行矩阵转置操作,这种方法需要增加硬件指令给以支持,才能更好地提高其效率。时间开销为O(logn)。另外Inte公司、MIPS公司和Motorola公司各自提出自己的矩阵转置方法,虽不完全相同,但其时间开销是一样的。
硬件方法方面,目前已经实现了多种设计方案,例如脉动阵列(Systolic Array)模块、通用阵列结构(Universal Array Architecture)及存储斜移(Memory Skewing)等。
(1)Systolic Array方法
Systolic Array方法的矩阵转置操作简单,数据按列或按行加载,从顶部读出,实现矩阵转置操作。对于一个n×n的矩阵,需要3n-1步才能完成矩阵转置。然而用寄存器和组合开关实现,其硬件代价较高。
(2)Universal Array Architecture方法
Universal Array Architecture方法比Systolic Array方法既简洁且效率又高,数据可以以行(列)的方式一次写入一行(列),当所有数据加载完成时,时以列(行)的方式一次读出一列(行),数据全部读出,完成转置。对于一个n×n的矩阵,需要2n+1步才能完成矩阵转置操作。然而该方法用寄存器和组合开关实现,硬件代价高,功耗大。
(3)Memory Skewing方法
Memory Skewing方法用并行的存贮器系统实现矩阵的行列操作,曾用于Illiac IV和BSP计算机系统中,但是这要增加很多硬件开销,从而降低了访存速度,由于太复杂而没有太多使用价值。
目前,大规模集成电路的工艺越来越小,已达到了10nm的水平,集成度要求越来越高,不论是通用CPU或是DSP,都是从一核向多核的方向发展,对处理能力的要求一再提升,从标量运算处理到向量运算处理,从向量运算处理到矩阵运算处理,对矩阵的运算粒度也是从小粒度到大粒度,不断有新的要求提出。为适应新的发展需求,对面向向量运算、面向矩阵运算的巨型机以及DSP,要具有矩阵寄存器体支撑的矩阵运算单元。矩阵计算遇到的首要问题之一就是矩阵的转置,在未来的矩阵计算机结构中,首先需要的是一个高效能的、低功耗的、结构灵活多变、多功能的矩阵转置部件。而目前现有的矩阵转置方法中,不论是通过软件方法,或是通过专门的硬件,或是通过SIMD(Single Instruction Multiple Data,单指令多数据流)网络结构,或是利用现有存储器的方法实现矩阵转置,都不能简单、高效、灵活地满足矩阵计算机的要求。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310367449.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:组合式系列多面体家具
- 下一篇:组合抽屉及其组装方法