[发明专利]基于HVS&ROI的分布式编解码方法及系统有效
申请号: | 201210377970.4 | 申请日: | 2012-10-08 |
公开(公告)号: | CN103002280A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 丁恩杰;黄河;袁莎莎;仲亚丽;徐卫东;向洁 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/50 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 唐惠芬 |
地址: | 221116 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于HVS&ROI的分布式编码方法及系统,属于分布式编码方法及系统,该系统由编码器和解码器两部分构成。编码器结合HVS的JND模型将输入视频Wyner-Ziv帧划分为C宏块和AC宏块,并对AC宏块提取ROI,对K帧与WZ帧各个宏块进行独立编码;解码器对接收到的码流进行联合解码。本发明由于引入人类视觉系统HVS的JND模型,减少了JND阈值一下区域的数据处理与传输工作,降低传输速率,起到节省能耗与带宽的作用;本发明由于对运动剧烈与亮度对比较大的眩光区域提取ROI感兴趣区,并对其进行熵编码,在尽量不增加编码复杂度的情况下,改善主观质量。 | ||
搜索关键词: | 基于 hvs roi 分布式 解码 方法 系统 | ||
【主权项】:
1.一种基于HVS&ROI的分布式视频编码方法,其特征在于:所述的编码方法的具体步骤是:a.将输入视频帧分为关键帧和Wyner-Ziv帧,对关键帧(K帧)进行帧内编码,所述的关键帧为K帧,H.264帧内编码器对关键帧进行帧内编码;对Wyner-Ziv帧进行HVS&ROI Wyner-Ziv编码;b.所述HVS&ROI Wyner-Ziv编码的方法包括:通过HVS的JND模型将Wyner-Ziv帧划分为C宏块和AC宏块;所述JND模型方法包括:b1.将Wyner-Ziv帧分成8×8分块,每个分块都是B块;;b2.根据下式计算出B块中各像素点的JND阈值:JND(x,y,t)=f(idl(x,y,t))JNDs(x,y)其中,idl(x,y,t)表示相邻t时刻与t-1时刻的平均帧间亮度误差值,JNDs(x,y)表示JND在空间域阈值;idl ( x , y , t ) = 1 2 ( I ( x , y , t ) - I ( x , y , t - 1 ) + I ‾ ( x , y , t ) - I ‾ ( x , y , t - 1 ) ) ]]> JNDs(x,y)=Tl(x,y)+TYt(x,y)-CY×Min{Tl(x,y),TYt(x,y)}其中,Tl(x,y)表示背景亮度适应影响函数,TYt(x,y)表示纹理影响函数反应HVS对于平滑区比纹理密集区的敏感性更强,(x,y)表示图像中像素点相应坐标,CY表示背景亮度与纹理掩蔽两种影响因素之间的相关系数;b3.根据下式计算当前块B块的前向、后向与平均像素SAD:SAD = Σ x = 1 M Σ y = 1 N | w ( x , y ) - r ( x , y ) | ]]> 其中,w(x,y)和r(x,y)分别表示WZ帧中编码块与参考块在坐标(x,y)处的像素值;b4.由下式得到编码端边信息ESI:ESI=MinSAD{FB,BB,AB}其中,FB为前向相邻帧对应块,FB为Forward Block的缩写;BB为后向相邻帧对应块,BB为Backward Block的缩写;AB为前后相邻帧对应平均块,AB为Average Block的缩写;b5.分别计算相邻帧SADB中的最大值和最小值记分别求出t<SADB与t>SADB时的像素点比例ρ0、ρ1与平均梯度值m0、m1,则总平均梯度值为:m=ρ0m0+ρ1m1;b6.计算前景与背景的方差为:v=ρ0ρ1(m0-m1)2;b7.在区间上遍历v找出最大值vMax,vMax所对应的t为前景与背景方差最大之时,此时t值即为阈值TROI;b8.根据得到的TROI值初步提取出前景图像,通过比较SADB与TROI的值来提取前景图像,对于大于TROI值的部分提取出来作为前景图像,然后将前景图像按步骤b5到b8再执行一遍,得到更加精确的二级TROI;b9.根据ESI的失真函数D(x,y)计算各点的预测失真,由下式得到各点的预测失真值:D(x,y)=|ESI(x,y)-I(x,y)|其中,ESI(x,y)和I(x,y)分别表示WZ帧中坐标(x,y)处的ESI值和像素值。b10.根据下式对块B进行JND判别,划分AC块与C块,对于失真值小于等于JND阈值的宏块划分成C块,而对于失真值大于JND阈值的宏块划分为AC块,并得到该WZ帧图像块划分的二值掩码Blockmask:Block mask = 1 ( Σ JND mask ) ≥ ϵ · Num 0 ( Σ JND mask ) < ϵ · Num ]]>JND mask = 1 ( JND ( x , y ) ≥ D ( x , y ) ) 0 ( JND ( x , y ) < D ( x , y ) ) ]]> 其中,Num为每一宏块中像素点的总数量,ε取0.1。b11.对AC块做DCT和2M级统一量化,提取系数带并进行Zigzag扫描,根据选定的量化矩阵对变换系数进行均匀量化;并根据下式计算K帧和WZ帧相同位置AC块梯度的SADB;SAD B = Σ ( j , k ) ∈ B | G K [ F ( j , k ) ] - G W [ F ( j , k ) ] | ]]> 其中K表示关键帧、W是Wyner-Ziv帧、B是单个的宏块、F(j,k)为z坐标(j,k)处的像素值。b12.采用下式ROI宏块判定准则,得到感兴趣区二值掩码ROImask:ROI mask = 1 ( SAD B ≥ T ROI ) 0 ( SAD B < T ROI ) ]]> 其中,ROImask为感兴趣区的二值掩码,当宏块梯度SADB小于梯度T则置为0,否则为1;对二值掩码ROImask进行简单的形态学处理,先腐蚀然后再扩张,使物体轮廓平滑,再由下式提取ROI:ROI = W B ( W B ⊆ ROI mask ) 0 ( W B ⊂⃒ ROI mask ) ]]> 其中,WB表示当前WZ帧中所对应的AC宏块,如果WB对应ROImask为1则为ROI块,反之置0为非ROI块,最终得到当前帧的ROI感兴趣区;b13.对Blockmask、ROImask以及量化后的ROI块进行哈弗曼编码压缩;对AC宏块的非ROI块提取位平面进行LDPC编码,若当前编码的图像组是最后一个图像组,则退出HVS&ROI分布式视频编码;c.对AC宏块提取ROI,对ROI宏块与各个宏块的标记信息进行熵编码,对非ROI宏块进行基于LDPC(这里的LDPC可以引用上面的定义)的Wyner-Ziv编码;d.所述的解码方法的具体步骤是:d1.对H.264的帧内解码获得关键帧;d2.对ROI宏块与各个宏块的标记信息进行哈弗曼熵解码,获得Blockmask、ROImask以及ROI块的量化系数;d3.设置信道估计参数,采用交叉熵最小法则估计信道参数,根据已解码出来的WZ帧的前后相邻关键帧进行运动补偿内插得到初始边信息SI;d4.利用边信息通过LDPC编码结合各个宏块的标记信息得到非ROI块的比特流系数;d5.将根据Blockmask得到的C块,熵解码的ROI块和块译码的非ROI块进行重构;
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210377970.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种酪胺盐酸盐的制备方法
- 下一篇:一种丙烯羰基合成的方法