[发明专利]一种适用于HEVC标准的高吞吐率DCT和IDCT硬件复用结构有效
申请号: | 201510033123.X | 申请日: | 2015-01-22 |
公开(公告)号: | CN104581174B | 公开(公告)日: | 2018-04-03 |
发明(设计)人: | 范益波;谢峥;黄磊磊;王利鸣;程魏;曾晓洋 | 申请(专利权)人: | 复旦大学 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;H04N19/625 |
代理公司: | 上海正旦专利代理有限公司31200 | 代理人: | 陆飞,盛志范 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 hevc 标准 吞吐 dct idct 硬件 结构 | ||
1.一种可配置的高吞吐率DCT和IDCT硬件复用结构,适用于HEVC视频编码标准下视频编码器和解码器,其特征在于由四种基本的硬件结构单元组成:①N点排序单元,记为PE_N;②4点DCT和IDCT硬件复用单元,记为A4/A4T;③N点奇数矩阵计算单元,记为RN/RNT;④N点蝶形单元,记为BE_N;N=4,8,16,32;
以A4 和A4T为基本单元,X表示输入,Y表示相应的DCT或IDCT的输出,下述公式(2)-(5)显示实现固定吞吐率32piexs/cycle的DCT需要的硬件,公式(6)-(9)显示实现固定吞吐率32piexs/cycle的IDCT需要的硬件,不同尺寸的DCT和IDCT之间部分硬件共享:
[Y040T,Y041T,Y042T,Y043T,Y140T,Y141T,Y142T,Y143T]T=
diag(A4,A4,A4,A4,A4,A4,A4,A4)*[X040 X041 X042 X043 X140 X141 X142 X143]T(2)
[Y80T,Y81T,Y82T,Y83T]T=diag(A8,A8,A8,A8)*[X80 X81 X82 X83]T
diag(P8,P8,P8,P8)*diag(A4,R4,A4,R4,A4,R4,A4,R4)*diag(B8,B8,B8,B8)*[X80 X81 X82X83]T(3)
[Y160T,Y161T]T=diag(A16,A16)*[X160 X161]T
=diag(P16,P16)*diag(A8,R8,A8,R8)*diag(B16,B16)*[X160 X161]T
=diag(P16,P16)*diag(P8,E8,P8,E8)*diag(A4,R4,R8,A4,R4,R8)*diag(B8,E8,B8,E8)*
diag(B16,B16)*[X160 X161]T(4)
Y32=A32*X32T=P32*diag(A16,R16)*B32*X32T
=P32*diag(P16,E16)*diag(A8,R8,R16)*diag(B16,E16)*B32*X32T=
P32*diag(P16,E16)*diag(P8,E24)*diag(A4,R4,R8,R16)*diag(B8,E24)*
diag(B16,E16)*B32*X32T(5)
[Y040T,Y041T,Y042T,Y043T,Y140T,Y141T,Y142T,Y143T]T=
diag(A4T,A4T,A4T,A4T,A4T,A4T,A4T,A4T)*[X040 X041 X042 X043 X140 X141 X142 X143]T(6)
[Y80T,Y81T,Y82T,Y83T]T=diag(A8T,A8T,A8T,A8T)*[X80 X81 X82 X83]T
=diag(B8,B8,B8,B8)*diag(A4T,R4T,A4T,R4T,A4T,R4T,A4T,R4T)*diag(P8T,P8T,P8T,P8T)*
[X80 X81 X82 X83]T(7)
[Y160T,Y161T]T=diag(A16,A16)*[X160 X161]T
=diag(B16,B16)*diag(A8T,R8T,A8T,R8T)*diag(P16T,P16T)*[X160 X161]T
=diag(B16,B16)*diag(B8,E8,B8,E8)*diag(A4T,R4T,R8T,A4T,R4T,R8T)*diag(P8T,E8,P8T,E8)*
diag(P16T,P16T)*[X160 X161]T(8)
Y32=ANT*X32T=B32*diag(B16,E16)*diag(B8,E8,E8,E8)
*diag(A4T,R4T,R8T,R16T)*diag(P8T,E8,E8,E8)*diag(P16T,E16)*P32T*X32T(9)。
2.根据权利要求1所述的可配置的高吞吐率DCT和IDCT硬件复用结构,其特征在于:
RN用于DCT计算的N点奇数矩阵,RNT用于IDCT计算的N点奇数矩阵;RN和RNT中对应位置的元素绝对值相同,符号不同;符号具有如下规律:偶数行中偶数列对应位置的元素符号相同,奇数列对应位置的元素符号不同;奇数行中偶数列对应位置的元素符号不同,奇数列对应位置的元素符号相同;
RN和RNT矩阵运算的硬件实现可以基于多常数乘法器和log2N级加法器树阵列实现;调整加法器树的输入顺序,并对第一级加法器的输出结果进行有选择的取反控制,即实现RN和RNT单元的硬件复用;
复用A4和A4T,RN和RNT的硬件单元和两套蝶形硬件单元及两套排序单元,得到DCT与IDCT复用模块的硬件结构, N=4,8,16;蝶形硬件单元包括一个BE_32模块,两个BE_16模块,四个BE_8模块;排序硬件单元包括一个PE_32模块,两个PE_16模块,四个PE_8模块;需要的矩阵运算单元包括八个A4和A4T复用模块,四个R4和R4T复用模块,两个R8和R8T复用模块,一个R16和R16T复用模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510033123.X/1.html,转载请声明来源钻瓜专利网。