[发明专利]基于模式偏移的混洗开关矩阵压缩方法有效
申请号: | 201010559286.9 | 申请日: | 2010-11-25 |
公开(公告)号: | CN101986262A | 公开(公告)日: | 2011-03-16 |
发明(设计)人: | 陈海燕;刘胜;陈书明;万江华;刘衡竹;陈跃跃;刘仲;张凯;刘祥远;李振涛 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/315 |
代理公司: | 湖南兆弘专利事务所 43008 | 代理人: | 周长清 |
地址: | 410073 湖南省长沙市开福区砚瓦池正街47号*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模式 偏移 开关 矩阵 压缩 方法 | ||
技术领域
本发明主要涉及采用单指令流多数据流(Single Instruction stream Multiple Data streams,SIMD)技术的通用处理器或数字信号处理器(Digital Signal Processor,DSP)领域,特指一种应用于SIMD或DSP中的混洗开关矩阵压缩方法。
背景技术
以子字并行和向量技术为代表的SIMD技术在解决媒体处理和无线通信等数据运算密集型应用中具有很大的优势,因而得到了广泛的应用和发展,受到了处理器特别是DSP的青睐。混洗单元主要负责SIMD部件各个处理单元寄存器之间数据的交互,是制约并行的处理单元性能发挥的关键部件。
混洗单元的硬件主体结构一般有以下三种方式,分别为交叉开关(Crossbar)、多级网络和完全混洗-交换网络。这三种结构当中Crossbar的灵活性最强,多级网络次之,完全混洗-交换网络最差;完全混洗-交换网络的硬件实现开销最小且扩展性也比较好,多级网络次之,Crossbar最差。由于嵌入式应用需要的混洗模式的多样性,Crossbar的使用最为广泛,本发明所论述的方法也以混洗单元的硬件结构为Crossbar为背景。
在以Crossbar为主要硬件结构的混洗单元中,混洗模式是和控制控制Crossbar中每个开关节点断开或导通的01值组成的矩阵是一一对应的。将控制Crossbar中每个开关节点断开或导通的01值组成的矩阵称之为开关矩阵,用户在执行混洗指令时(或之前)必须直接或间接告诉Crossbar本次混洗所需要的开关矩阵。由于开关矩阵本身的数据量比较大,需要对其进行压缩,一方面,这种压缩是非常必要的,开关矩阵的数据量和SIMD数据通路的宽度的平方成正比,随着SIMD数据通路的宽度的增加,开关矩阵的数据量会急剧膨胀;另一方面,必须要考虑到解压时电路的复杂性,宜采用比较简单的压缩-解压技术,以便在关键路径延时和压缩效率方面进行折衷。
一个应用程序所需要的所有混洗模式在程序执行之前都是确定的,在程序的预处理阶段需要对混洗请求做一些额外的工作,以便在执行某一条混洗指令时能够访问到正确的混洗模式,一般采用混洗模式表记录应用程序所需要的混洗模式,同时对每个混洗请求标识其混洗模式在混洗模式表的表项地址。在应用程序执行前,需要提前将混洗模式表中的数据加载到存储器中,以便供混洗指令使用。
传统的混洗单元和混洗指令中,一般采用最小数据粒度索引法来进行压缩。图1 是采用最小数据粒度索引法的开关矩阵压缩流程示意图:首先对当前混洗请求的数据粒度设置为Crossbar支持的最小数据粒度,然后按照当前粒度索引法(图4所描述的方法)对当前请求的开关矩阵进行压缩,接着判断压缩后的混洗模式是否与混洗模式表中保存的某一个混洗模式完全相同,如果相同则在当前的混洗指令当中增加地址信息(该地址指向混洗模式表中与当前混洗模式相同的表项的地址);如果不同,则在混洗模式表中将当前混洗模式添加进去,并在当前的混洗指令中增加指向当前表项的地址。循环处理,直到所有的混洗请求都处理完毕。
以摩托罗拉公司为设计主体的AltiVec指令集为例,在AltiVec指令集中,向量的宽度为128 bits(16个字节),且混洗的最小数据粒度为8 bits,AltiVec指令集中的混洗指令VPERM使用了一个向量寄存器(128bit)表示混洗模式,该向量寄存器共分为16个域(每一个8 bits),分别指示目标向量寄存器的每一个字节分别来自源向量寄存器中的哪一个字节(即每一个域表示了开关矩阵中的一行),类似的还有飞利浦公司的EVP处理器的SHF指令。
这种最小数据粒度索引法的开关矩阵压缩方法在目前的向量处理器中使用比较广泛,但这种方法并未考虑一个应用程序中不同混洗请求之间的模式偏移关系,对于混洗模式存在偏移关系的混洗请求的混洗模式是分别存储的,造成了整个应用程序的混洗指令的开关矩阵的压缩率较低。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种原理简单、操作简便、适用范围广、能够增大相同容量的混洗模式存储器中包含的有效混洗模式的数、提高程序中混洗请求开关矩阵的压缩效率的基于模式偏移的混洗开关矩阵压缩方法,同时其解压逻辑增加的逻辑量不大,对现有关键路径延时影响较小。
为解决上述技术问题,本发明采用以下技术方案:
一种基于模式偏移的混洗开关矩阵压缩方法,其特征在于步骤为:
步骤1:预设SF_Table为存储混洗模式的表;对当前混洗请求的数据粒度设置为交叉开关支持的最小数据粒度,按照当前粒度索引法进行压缩;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010559286.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:相机设备
- 下一篇:打印数据处理装置及打印数据处理方法