[发明专利]SATD快速实现的硬件架构无效
申请号: | 200910106094.X | 申请日: | 2009-03-25 |
公开(公告)号: | CN101583038A | 公开(公告)日: | 2009-11-18 |
发明(设计)人: | 王明江;张爱平;颜琥;商迪 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | H04N7/26 | 分类号: | H04N7/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518055广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | satd 快速 实现 硬件 架构 | ||
1、SATD的快速硬件实现方法,其特征在于4*4块Hadamard变换矩阵的并行处理硬件架构的设计。
2、根据权利要求1所述的4*4块Hadamard变换矩阵的并行处理硬件架构实现方法,其特征在于以下几个步骤,
步骤B1:为了设计Hadamard变换硬件并行计算架构,首先将Hadamard变换公式展开得到16个计算矩阵元素的等式。
步骤B2:步骤B1中16个计算矩阵元素的等式总共需要240个加、减法操作。观察上述等式,很多操作可以复用,设置16个中间变量t11~t44,步骤B1中的16个矩阵元素的等式可以采用中间变量表示,该方法提供了中间结果的复用。采用步骤B2方法计算Hadamard变换矩阵元素总共需要80个加、减法操作。
步骤B3:采用4-2压缩器设计Hadamard变换矩阵的硬件并行处理架构。步骤B2中计算每个中间值tij每位需要一个4-2压缩器实现,中间变量每位总共需要16个4-2压缩器;从中间变量计算Hadamard变换结果矩阵元素时,每个元素每位需要2个4-2压缩器加法器,4*4Hadamard变换矩阵每位需要32个4-2压缩器;高位采用符号扩展,最多需要13位操作,总共需要624个4-2压缩器。
3、根据权利要求2中步骤B3所述的采用4-2压缩器设计Hadamard变换矩阵的硬件并行处理架构,针对不同的Hadamard变换矩阵元素,其特征在于以下步骤,
步骤C1:对残差值先进行四种形式的变换,得到进行特殊wallace阵列的四组并行输入数据。它们为{a11,a12,a13,a14;a21,a22,a23,a24;a31,a32,a33,a44;a41,a42,a43,a44}{a11,a12,~a13,~a14;a21,a22,~a23,~a24;a31,a32,~a33,~a44;a41,a42,~a43,~a44}{a11,~a12,~a13,a14;a21,~a22,~a23,a24;a31,a32,~a33,~a44;a41,~a42,~a43,a44}{a11,~a12,a13,~a14;a21,~a22,a23,~a24;a31,~a32,a33,~a44;a41,~a42,a43,~a44}
步骤C2:将输入的四组数据首先进行并行的4-2压缩加法。
对于第一组输入得到的值为
t11=a11+a12+a13+a14; t21=a21+a22+a23+a24;
t31=a31+a32+a33+a34; t41=a41+a42+a43+a44;
对于第二组输入,得到的值为:
t12=a11+a12-a13-a14; t22=a21+a22-a23-a24;
t32=a31+a32-a33-a34; t42=a41+a42-a43-a44;
对于第三组输入得到的值为
t13=a11-a12-a13+a14; t23=a21-a22-a23+a24;
t33=t31-a32-a33+a34; t43=a41-a42-a43+a44;
对于第四组输入,得到的值为:
t14=a11-a12+a13-a14; t24=a21-a22+a23-a24;
t34=a31-a32+a33-a34; t44=a41-a42+a43-a44;
并把这四组得到的值以交叉的组合形式作为第二级流水的输入;
步骤C3:将输入到第二级流水的数据做四组并行的4-2压缩加法。
第一组得到的值为t11+t12;t11-t12;t13+t14;t13-t14;
第二组得到的值为t21+t22;t21-t22;t23+t24 t23-t24;
第三组得到的值为t31+t32;t31-t32;t33+t34;t33-t34;
第四组得到的值为t41+t42;t41-t42;t43+t44;t43-t44。
并把这些值以交叉的组合形式作为第三级流水的输入;
步骤C4:将输入到第三级流水的数据做四组并行的4-2压缩加法。
第一组得到值 d11=t11+t21+t31+t41; d21=t11+t21-t31-t41;
d31=t11-t21-t31+t41; d41=t11-t21+t31-t41;
第二组得到值
d12=t12+t22+t32+t42; d22=t12+t22-t32-t42;
d32=t12-t22-t32+t42; d42=t12-t22+t32-t42;
第三组得到值
d13=t13+t23+t33+t43; d23=t13+t23-t33-t43;
d33=t13-t23-t33+t43; d43=t13-t23+t33-t43;
第四组得到值
d14=t14+t24+t34+t44; d24=t14+t24-t34-t44;
d34=t14-t24-t34+t44; d44=t14-t24+t34-t44;
并把这些值存入寄存器作为下级流水的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910106094.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:前驱动轮四轮踏溜车
- 下一篇:一种机顶盒的遥控操作功能界面的装置及方法