[发明专利]一种面向全景视频的全局运动估计方法无效
申请号: | 200710130318.1 | 申请日: | 2007-07-17 |
公开(公告)号: | CN101350920A | 公开(公告)日: | 2009-01-21 |
发明(设计)人: | 张晨 | 申请(专利权)人: | 北京华辰广正科技发展有限公司 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100053北京市宣武*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 全景 视频 全局 运动 估计 方法 | ||
技术领域
本发明涉及图象视频压缩技术,特别涉及全景视频的全局运动估计方法。
背景技术
全景视频(panoramic video)也称为沉浸式视频(immersive video)。观察者视点不能随意变,改变观察方向能够观察到周围的全部场景。普通的二维视频只反应了全方位视频的某个局部,难以使人产生身临其境的沉浸感,利用全景视频可以建立起供用户观察的虚拟环境。用户通过在其中的漫游,能够交互地从不同观察点和方向了解环境。全景视频摄像机的示意图如图1所示,由多个摄像机对同一视点周围的场景进行采集处理。任何一个视角的二维场景都可以由这些采集的图像绘制出来。全景视频可以应用于广播、存储和交互式的在线应用等。
全景视频的生成是面向一种图象拼接技术。首先用若干个摄像机采集不同角度的实时图像(需要的摄像机个数与采集的角度有关),然后把同一时间内采集到的不同角度的图象用一种无缝的图像拼接技术缝合成一幅360度的全景图。然后再把这幅全景图用柱面或者球面算法映射到一个二维的平面上。由于全景视频图像是由多幅采集图像缝合而成,因此,一般来说,全景图像的分辨率非常大,譬如说,2048×768。考虑一个每秒25帧的全景视频序列,则一秒的数据量达到112M。如此庞大的数据,不经过有效压缩,是无法进行存储,更不用说实时传输。因此,研究研究全景视频的压缩技术,尤其具有理论和现实意义。
目前在大多数视频编码标准中,采用的传统的运动补偿估计方法是面向平移运动参数模型的。该模型假设刚性物体只在二维空间里的水平和垂直方向上做平移运动,并没有充分考虑摄像机的旋转和缩放运动。而在全景视频里,摄像机的旋转和缩放运动是占有很重要位置的视觉流运动。采用传统的平移运动参数模型,无法有效的精确估计物体的实际运动,必将使得运动补偿后的图像残差大大增加,从而达不到有效压缩全景视频的目的。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于仿射运动模型的运动估计方法,用于有效压缩全景视频
为了达到上述目的,本发明采取如下技术方案:
一种面向全景视频的运动估计方法,包括以下步骤:
(1)把每一帧全景视频分割成互不重叠的16×16宏块;
(2)使用一种快速运动估计方法对全景视频帧里的16×16宏块分别做局部运动估计,得到面向宏块的运动矢量;
(3)建立全局运动估计参数模型;
(4)使用高斯牛顿迭代方法得到全局运动估计的运动参数;
(5)传输当前帧的全局运动参数,在解码端对当前帧做全局运动补偿。
进一步地,步骤(1)中,块的划分大小为16×16。
进一步地,步骤(2)中,所使用的快速运动估计方法是三步快速运动估计算法。
进一步地,搜索范围是64×64,半像素精度搜索。
进一步地,步骤(3)中,全局运动估计参数模型是仿射运动参数模型。
进一步地,该仿射运动参数模型是模拟全景视频中的平移、旋转和缩放运动。
进一步地,所述步骤(4)中,运动参数估计算法是基于高斯牛顿迭代算法。
进一步地,该高斯牛顿算法是基于最小化预测残差迭代计算的,预测残差是指原始帧和预测帧之间的差。
进一步地,所述步骤(5)中,全局运动参数的编码是基于三维VLC变长编码。
进一步地,该三维VLC变长编码使用的是36个码本。
本发明方法的优点在于:
(1)针对全景视频的特点,设计了一种有效的全局运动估计方法,相对传统的运动补偿估计方法,编码码率大大降低,主观重构视频质量得到提高;
(2)在估计全局运动参数时,使用高斯牛顿迭代算法,有效节省运算时间。
附图说明
图1是本发明实施例中由多个摄像机对同一视点周围场景进行采集处理的示意图;
图2是本发明实施例中基于菱形算法的大小搜索模板示意图;
图3是本发明实施例中基于菱形算法的快速运动搜索示意图;
图4是本发明实施例中面向全景视频的全局运动估计系统流程图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细描述:
如图4所示,为本发明的一种面向全景视频的全局运动估计方法的操作流程图。该方法的操作步骤包括:
步骤10中,划分每一帧图像为若干个16×16的宏块。若亮度的预测值和原始值的差,即亮度残差大于一个设定的阀值MSEsplitThr,见以下公式,则16×16块再度划分为8×8块:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华辰广正科技发展有限公司,未经北京华辰广正科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710130318.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:婴儿呼吸复苏囊
- 下一篇:捻股机牵引塔轮张力摩擦装置