[发明专利]SATD快速实现的硬件架构无效

专利信息
申请号: 200910106094.X 申请日: 2009-03-25
公开(公告)号: CN101583038A 公开(公告)日: 2009-11-18
发明(设计)人: 王明江;张爱平;颜琥;商迪 申请(专利权)人: 哈尔滨工业大学深圳研究生院
主分类号: H04N7/26 分类号: H04N7/26
代理公司: 暂无信息 代理人: 暂无信息
地址: 518055广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: satd 快速 实现 硬件 架构
【权利要求书】:

1、SATD的快速硬件实现方法,其特征在于4*4块Hadamard变换矩阵的并行处理硬件架构的设计。

2、根据权利要求1所述的4*4块Hadamard变换矩阵的并行处理硬件架构实现方法,其特征在于以下几个步骤,

步骤B1:为了设计Hadamard变换硬件并行计算架构,首先将Hadamard变换公式展开得到16个计算矩阵元素的等式。

步骤B2:步骤B1中16个计算矩阵元素的等式总共需要240个加、减法操作。观察上述等式,很多操作可以复用,设置16个中间变量t11~t44,步骤B1中的16个矩阵元素的等式可以采用中间变量表示,该方法提供了中间结果的复用。采用步骤B2方法计算Hadamard变换矩阵元素总共需要80个加、减法操作。

步骤B3:采用4-2压缩器设计Hadamard变换矩阵的硬件并行处理架构。步骤B2中计算每个中间值tij每位需要一个4-2压缩器实现,中间变量每位总共需要16个4-2压缩器;从中间变量计算Hadamard变换结果矩阵元素时,每个元素每位需要2个4-2压缩器加法器,4*4Hadamard变换矩阵每位需要32个4-2压缩器;高位采用符号扩展,最多需要13位操作,总共需要624个4-2压缩器。

3、根据权利要求2中步骤B3所述的采用4-2压缩器设计Hadamard变换矩阵的硬件并行处理架构,针对不同的Hadamard变换矩阵元素,其特征在于以下步骤,

步骤C1:对残差值先进行四种形式的变换,得到进行特殊wallace阵列的四组并行输入数据。它们为{a11,a12,a13,a14;a21,a22,a23,a24;a31,a32,a33,a44;a41,a42,a43,a44}{a11,a12,~a13,~a14;a21,a22,~a23,~a24;a31,a32,~a33,~a44;a41,a42,~a43,~a44}{a11,~a12,~a13,a14;a21,~a22,~a23,a24;a31,a32,~a33,~a44;a41,~a42,~a43,a44}{a11,~a12,a13,~a14;a21,~a22,a23,~a24;a31,~a32,a33,~a44;a41,~a42,a43,~a44}

步骤C2:将输入的四组数据首先进行并行的4-2压缩加法。

对于第一组输入得到的值为

                          t11=a11+a12+a13+a14;    t21=a21+a22+a23+a24

                          t31=a31+a32+a33+a34;    t41=a41+a42+a43+a44

对于第二组输入,得到的值为:

                          t12=a11+a12-a13-a14;    t22=a21+a22-a23-a24

                          t32=a31+a32-a33-a34;    t42=a41+a42-a43-a44

对于第三组输入得到的值为

                        t13=a11-a12-a13+a14;    t23=a21-a22-a23+a24

                        t33=t31-a32-a33+a34;    t43=a41-a42-a43+a44

对于第四组输入,得到的值为:

                        t14=a11-a12+a13-a14;    t24=a21-a22+a23-a24

                        t34=a31-a32+a33-a34;    t44=a41-a42+a43-a44

并把这四组得到的值以交叉的组合形式作为第二级流水的输入;

步骤C3:将输入到第二级流水的数据做四组并行的4-2压缩加法。

第一组得到的值为t11+t12;t11-t12;t13+t14;t13-t14;

第二组得到的值为t21+t22;t21-t22;t23+t24 t23-t24;

第三组得到的值为t31+t32;t31-t32;t33+t34;t33-t34;

第四组得到的值为t41+t42;t41-t42;t43+t44;t43-t44。

并把这些值以交叉的组合形式作为第三级流水的输入;

步骤C4:将输入到第三级流水的数据做四组并行的4-2压缩加法。

第一组得到值    d11=t11+t21+t31+t41;   d21=t11+t21-t31-t41

                d31=t11-t21-t31+t41;   d41=t11-t21+t31-t41

第二组得到值

                d12=t12+t22+t32+t42;    d22=t12+t22-t32-t42

                d32=t12-t22-t32+t42;    d42=t12-t22+t32-t42

第三组得到值

                d13=t13+t23+t33+t43;    d23=t13+t23-t33-t43

                d33=t13-t23-t33+t43;    d43=t13-t23+t33-t43

第四组得到值

                d14=t14+t24+t34+t44;    d24=t14+t24-t34-t44

                d34=t14-t24-t34+t44;    d44=t14-t24+t34-t44

并把这些值存入寄存器作为下级流水的输入。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910106094.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top