[发明专利]一种利用运动特征的像素域视频转码结构设计方法无效
申请号: | 200910100073.7 | 申请日: | 2009-06-22 |
公开(公告)号: | CN101583037A | 公开(公告)日: | 2009-11-18 |
发明(设计)人: | 邢卫;魏平 | 申请(专利权)人: | 浙江大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/50 |
代理公司: | 杭州求是专利事务所有限公司 | 代理人: | 张法高 |
地址: | 310027*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 运动 特征 像素 视频 结构设计 方法 | ||
技术领域
本发明涉及视频信息转码技术,具体地涉及一种利用运动特征的像素域视频转码结构设计方法,属于计算机多媒体技术领域。在解码的同时分析源视频的运动特征,并据此在后续编码时通过先验的模型选择合理的编码模式,从而获得好的转码性能。
背景技术
在多媒体应用中,目前多媒体通讯、网络协议的特点具有很大区别,不同的接入网络的传输性能有较大的差异,各种终端不同的处理能力对视频有不同的要求,各种视频编码格式本身也有很大差异。因此,在很多情况下都需要把适应某种传输网络和终端的视频内容转换成适应另外一种传输网络和终端的视频,视频转码变得非常重要。
在视频转码时,在相同的输出比特率条件下,人们总是期望在输出视频的质量保持基本相同时尽可能降低转码时间。所谓转码性能是在输出码率和视频质量基本相同条件下的转码时间;转码时间越少,转码性能就越高。
在像素域视频转码中,某些级联编码器在编码时可以选择多种编码模式,如多帧参考、亚像素预测、尺寸可变的宏块划分等。这些编码模式在给定目标码率的约束下提高视频质量的同时,会一定程度乃至剧烈地增加转码运算的时间。同时,不同运动特征的视频在选择不同编码模式时转码性能有很大的差异,如剧烈运动的视频采用尺寸可变的宏块划分预测能够显著地提高视频质量,但运动平缓的视频采用尺寸可变的宏块划分预测只能取得微小的视频提升,却耗费了大量的计算时间。因此,在视频的运动特征和恰当的编码模式之间存在某种对应关系。对于解码到像素域的源视频,如果能在后续级联的编码过程中选择那些能够明显提升视频质量的模式,而关闭那些对于视频质量提高没有多大帮助但却消耗很多计算量的模式,就会取得比较好的转码性能。
发明内容
为了利用丰富的视频资源,适应多种网络和终端,把一种格式的视频信息转换成另一种格式的视频信息非常重要。在转换过程中,在确定的输出码率下,保持输出的目标视频质量基本相同的同时应尽可能减少转码时间。为达到此目的,本发明提出一种利用运动特征的像素域视频转码结构设计方法。
一种利用运动特征的像素域视频转码结构设计方法,视频转码结构由解码器、运动特征统计单元、编码模式决策单元、编码器四部分组成。首先,解码器将输入的源视频解码到像素域,运动特征统计单元统计源视频的运动特征并形成表征,编码模式决策单元依据先验的运动特征与最优编码模式之间的对应关系模型选择最优编码模式,整个视频转码结构包括以下部分:
1)解码器,把输入的源视频流解码到像素域;
2)运动特征统计单元,统计输入源视频的运动特征;
3)编码模式决策单元,根据统计后的运动特征,依据先验的运动特征和编码模式之间的对应关系模型进行最优化编码模式的决策;
4)编码器,根据优化选择的编码模式对输入的像素域视频数据重新编码,输出目标视频。
所述的源视频是基于宏块划分且经过运动预测补偿、变换编码压缩过程的压缩视频。目标视频是基于宏块划分且经过运动预测补偿、变换编码压缩过程,且至少支持多帧参考、亚像素预测、尺寸可变的宏块划分、帧内预测多种编码模式的压缩视频。运动特征统计单元逐视频帧分析源视频中的运动特征,并通过运动向量幅值直方图表示。编码模式决策单元按照先验的运动特征和编码模式之间的对应关系模型,逐视频帧进行最优编码模式的决策。编码器以解码到像素域的视频数据作为输入,依据编码模式决策单元选定的最优编码模式,对像素域数据重新编码,输出目标视频。
本发明提出的视频转码结构通过逐帧分析源视频码流中的运动向量信息,利用运动特征和编码模式之间的关系模型,逐帧进行最优编码模式决策;与普通的级联转码器相比能够取得更好的转码性能。
附图说明
附图是利用运动特征的像素域视频转码结构的示意图。
具体实施方式
下面结合附图对本发明作进一步描述。
利用运动特征的像素域视频转码结构设计方法中的视频转码结构由解码器、运动特征统计单元、编码模式决策单元、编码器四部分组成。首先,解码器将输入的源视频解码到像素域,运动特征统计单元统计源视频的运动特征并形成表征,编码模式决策单元依据先验的运动特征与最优编码模式之间的对应关系模型选择最优编码模式,整个视频转码结构包括以下部分:
1)解码器2,把输入的源视频流解码到像素域;
2)运动特征统计单元6,统计输入源视频的运动特征;
3)编码模式决策单元8,根据统计后的运动特征,依据先验的运动特征和编码模式之间的对应关系模型进行最优化编码模式的决策;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910100073.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:身份多重检查验证系统
- 下一篇:光罩盒