[发明专利]基于感兴趣区域的快速降尺寸转码方法有效
申请号: | 201110312504.3 | 申请日: | 2011-10-14 |
公开(公告)号: | CN102510496A | 公开(公告)日: | 2012-06-20 |
发明(设计)人: | 贾克斌;吕卓逸;刘鹏宇 | 申请(专利权)人: | 北京工业大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/50 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于感兴趣区域的快速降尺寸转码方法,属于计算机数字视频转码技术领域。本发明步骤:(1)获取输入H.264编码码流中的编码信息,包括:帧间编码模式、运动矢量和离散余弦变换系数;将CIF格式像素的视频降尺寸为QCIF格式,即176像素×144像素;(2)根据图像纹理特征,利用运动边缘检测划分运动区域和背景区域;(3)对位于不同区域内的宏块,根据其运动特征采用相应的帧间模式;对位于运动区域的宏块,根据其运动差异性分别选择自适应运动矢量下采样方法或者最严重加权法进行运动矢量重建,对位于背景区域的宏块采用平均加权法进行运动矢量重建,对位于运动目标边缘和内部的宏块进行运动搜索。本方法既能够保证转码后视频质量,又解决了降尺寸转码实时性问题。 | ||
搜索关键词: | 基于 感兴趣 区域 快速 尺寸 方法 | ||
【主权项】:
1.基于感兴趣区域的快速降尺寸转码方法,其特征在于:利用输入H.264编码码流中的编码信息,将视频数据基于图像纹理特征利用运动边缘检测划分为运动区域和背景区域,对位于不同区域内的宏块根据其运动特征采用相应的转码策略,具体包括下述步骤:1)获取H.264编码码流中的编码信息,包括:帧间编码模式,运动矢量和离散余弦变换系数,即DCT系数;将CIF格式,即352像素×288像素的视频降尺寸为QCIF格式,即176像素×144像素;2)利用DCT系数,通过如下公式得到运动边缘:
式中
表示向下取整运算,i代表原始视频中与当前宏块对应的上、下、左、右四个相邻宏块,DCTi表示宏块i不为零的DCT系数的个数,通过垂直、水平方向逐行的块搜索,在降尺寸后的视频各帧中标记每行最左端和最右端该值大于0的当前宏块位置,以及每列最上端和最下端该值大于0的当前宏块位置,由各帧中被标记的宏块组成运动边缘序列;3)根据步骤2)得到的运动边缘序列,将各帧图像分为运动区域和背景区域,分别采用不同的帧间模式选择方法和运动矢量重建及修正方法进行转码;3.1)所述的帧间模式选择方法包括下述步骤:对位于运动区域内的宏块,计算其运动程度MAi:MA i = 1 4 Σ i = 0 3 ( | mv iv | + | mv ih | ) ]]> 式中,mvih,mviv代表宏块MBi在水平和垂直方向上的运动矢量;将MAi与预设的高低两个阈值TA_low=16和TA_high=32进行比较,如果MAi≤TA_low,则从原始视频中与当前宏块对应的上、下、左、右四个相邻宏块的模式中选择属于16×16,16×8,8×16三个中的模式,并分别计算其率失真代价,然后选择率失真代价最小的模式作为最终编码模式;如果没有16×16,16×8,8×16三个中的任何一种模式,则选用残差最大,即原始视频中与当前宏块对应的上、下、左、右四个相邻宏块中不为零的DCT系数个数最多宏块的模式作为最终编码模式;如果TA_low<MAi≤TA_high,则从原始视频中与当前宏块对应的上、下、左、右四个相邻宏块的模式中选择属于8×8,4×8,8×4,4×4四个中的模式,并分别计算其率失真代价,然后选择率失真代价最小的模式作为最终编码模式;如果没有8×8,4×8,8×4,4×4四个中的任何一种模式,则选用残差最大,即原始视频中与当前宏块对应的上、下、左、右四个相邻宏块中不为零的DCT系数个数最多宏块的模式作为最终编码模式;如果MAi>TA_high,则选择帧内预测模式Intra 16×16和Intra 4×4,并分别计算其率失真代价,选择率失真代价最小的模式作为最终编码模式;对于位于背景区域的宏块,如果原始视频中与当前宏块对应的上、下、左、右四个相邻宏块的模式中有不少于2个SKIP模式,则选择SKIP模式作为最终编码模式,否则选用残差最大,即原始视频中与当前宏块对应的上、下、左、右四个相邻宏块中不为零的DCT系数个数最多宏块的模式作为最终编码模式;3.2)所述的运动矢量重建及修正方法包括下述步骤:对于位于运动区域的宏块,利用计算方差的方法定义当前宏块MBj的运动差异性difj:dif j = Σ i = 0 3 ( mv ih - mv ‾ h ) 2 + ( mv iv - mv ‾ v ) 2 ]]> 其中,i代表原始视频中与当前宏块对应的上、下、左、右四个相邻宏块,mvih和mviv分别为宏块i水平及垂直方向上的运动矢量,
和
分别为原始视频中与当前宏块对应的上、下、左、右四个相邻宏块水平及垂直方向上的运动矢量平均值;通过将当前宏块的运动差异性与差异性平均值的比较设置差异性因子MDj:MD j = high , dif j 1 N Σ j = 0 N - 1 dif j ≥ 1 low , dif j 1 N Σ j = 0 N - 1 dif j < 1 zero , dif j = 0 ]]> 其中,N为一帧中的宏块数量;如果MDj的值为high,则表明原始视频中与当前宏块对应的上、下、左、右四个相邻宏块的运动较分散,采用自适应运动矢量下采样方法重建运动矢量mv’:mv ′ = 1 2 Σ i = 0 3 mv i DCT i Σ i = 0 3 DCT i ]]> 其中,mvi为原始视频中与当前宏块对应的上、下、左、右四个相邻宏块的运动矢量,DCTi分别为原始视频中与当前宏块对应的上、下、左、右四个相邻宏块不为零的DCT系数的个数;如果MDj的值不为high,则采用最严重加权法重建运动矢量mv’:mv ′ = 1 2 mv MAX { DCT i , i = 0,1,2,3 } ]]> 其中,mvMax{DCTi,i=0,1,2,3}表示选取原始视频中与当前宏块对应的上、下、左、右四个相邻宏块中不为零的DCT系数个数最多宏块的运动矢量;在获得重建的运动矢量后,以重建的运动矢量为搜索中心,在±2像素的范围内进行运动搜索,最终获得最匹配的运动矢量;最后输出降尺寸转码后的码流;对位于背景区域的宏块,采用平均加权法重建运动矢量mv’:mv ′ = 1 2 Σ i = 0 3 mv i 4 ]]> 其中,mvi为原始视频中与当前宏块对应的上、下、左、右四个相邻宏块的运动矢量;最后输出降尺寸转码后的码流。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110312504.3/,转载请声明来源钻瓜专利网。