[发明专利]基于H.264的立体视频编解码方法无效

专利信息
申请号: 200910030728.8 申请日: 2009-04-15
公开(公告)号: CN101540926A 公开(公告)日: 2009-09-23
发明(设计)人: 季晓勇;高民芳;刘芳;蒋里;刘栩;孙立;鲁昊明;杨晓琴;黄前山;陈智勇 申请(专利权)人: 南京大学
主分类号: H04N13/00 分类号: H04N13/00;H04N7/26;H04N7/50
代理公司: 南京天翼专利代理有限责任公司 代理人: 朱戈胜
地址: 210093江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 264 立体 视频 解码 方法
【说明书】:

技术领域;

发明属于视频或图像处理领域,更具体的是在立体视频处理过程中实现立体视频单路传输的方法和系统。

背景技术

随着科学技术的高速发展,以计算机、网络和电子技术为代表的信息技术获得了突飞猛进的发展。视频技术由黑白到彩色,再到今天的高清晰度数字视频,发展速度也极其迅猛。现代视频技术正在向“数字化”、“高清晰度化”和“立体化”方向发展。立体技术是未来视频技术的一个重要发展方向。但是立体视频数据量是单路视频的2倍,限制了其实际应用,因而立体视频或图像处理技术现已经成为一个研究热点。

H.264/MPEG-4 AVC(H.264)是1995年自MPEG-2视频压缩标准发布以后,由ITU-T和ISO/IEC的联合开发组共同开发的最新国际视频编码标准。其最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍,H.264标准也具有更好的信道适应性,应用前景更为广泛。这些都为立体视频编码技术提供了良好的平台,促进着立体视频编码研究的进一步发展。但是,H.264的高效性是建立在其实现的高复杂度基础上的,就其Baseline而言,解码器复杂度将是H.263解码器的3倍左右,而编码器的复杂度更是高达10多倍。H.264的高复杂度是制约其实时性发展的一个重要问题。而现有研究很大程度上局限于快速模式选择、快速匹配,以及如何从单目图像恢复双路图像,快速算法对复杂性的改进有限,而且与现有的显示设备不兼容,单路图像提取立体信息一方面不能有效利用目前双路摄像机已经普遍存在的情况下获取的立体信息,另一方面提取的深度信息精确性很低。因而急需一种在降低立体视频传输系统码率的基础上,简化H.264编解码器复杂度的立体图像处理方法。

发明内容

本发明的目的是在使用通用H.264编解码器基础上实现立体视频中双路视频的单路传输,并且接收端可选择的使用单路视频解码或者立体视频解码。

一种基于H.264的立体视频编解码方法,该方法是在立体视频数据嵌入系统中完成,该系统包括双路视频采集端、编码器模块、视频流发送模块和视频解码/接收端;

所述方法的步骤包括:

1)双路视频采集端分别获取左右眼的视频图像,左右眼的视频图像分别传送到各自对应的视频缓存中等待处理;

2)编码器模块对所述缓存中的双路视频图像数据进行处理:

先对运动/视差补偿,提取矢量信息;然后在对视频图像进行H.264编码过程中将所用矢量信息嵌入到参考图像中,最终得到视频流;实现双路视频的可单路传输性;

(参考图像是H.264编码过程中的专有名词,参考图像是H.264编码过程中用于运动补偿的同路的前一帧图像或者视差补偿的另一路的同一帧图像。)

3)通过视频流发送模块发送已编码视频流到视频解码/接收端,实现立体视频的单路传输;

4)所述视频解码/接收端包括普通H.264客户端和装有H.264立体图像解码器的客户端;普通H.264客户端对接收到的视频流进行单路图像解码,得到单路视频显示;装有H.264立体图像解码器的客户端根据嵌入的矢量信息对双路图像进行恢复,恢复得到的双路图像分别存入两个缓冲区,进而立体显示。

所述步骤2)中,对获取到双路视频并开辟两个缓冲区、分别存放两路图像后,先进行运动补偿、视差补偿;然后对参考图像依次进行分块、整数DCT变换、矢量信息嵌入、量化和编码步骤得到编码后的视频流。

所述步骤3)中,利用无线或有线的方式发送已编码视频流到互联网或客户端。

所述客户端包括存储设备。

视频发布服务器接收通过互联网接收到视频流,再把视频流传输到视频解码/接收端。

所述步骤4)中,接收端解码器选择是单路视频解码或立体视频解码,如果是单路视频解码,将嵌入数据位置0,然后进行通用H.264解码,或者直接进行通用H.264解码;如果是立体视频解码,开辟两个缓冲区,首先提取出嵌入的矢量信息并将嵌入数据位置0,将接受到的一路信号存入一个缓冲区,如果标志位为0,则矢量信息为运动矢量V_x、V_y,与缓冲区前一帧一起利用运动补偿模式恢复此帧;若标志位为1,则矢量信息为视差矢量V_x,V_y,与另一缓冲区当前帧一起恢复此帧。

所述编码器模块是DSP处理系统或ARM处理系统。

本发明的特点是:高效、简洁,实用性强,实时性方面是一个很大的改进,并且有效处理了双通道数据量庞大的问题,在现有单目视频图像编码发展技术已经成熟的基础上,实现了高信噪比的条件下高的压缩比。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910030728.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top