[发明专利]场景形式的视频流编码在审
申请号: | 201280015696.4 | 申请日: | 2012-01-26 |
公开(公告)号: | CN103503454A | 公开(公告)日: | 2014-01-08 |
发明(设计)人: | 罗德佛·瓦格斯·古耶瑞欧 | 申请(专利权)人: | 艾艾欧有限公司 |
主分类号: | H04N19/182 | 分类号: | H04N19/182;H04N19/124;H04N19/51 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 邬玥;葛强 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 场景 形式 视频 编码 | ||
1.一种利用场景形式编码视频流的方法,每一个场景形式有一或多个复数个编码器参数的一预定义集,该编码器参数被一视频编码器用于对任何给定场景形式进行编码,该方法包括:
接收一输入视频流;
基于场景边界信息,将该输入视频流分成多个场景,每一场景包括复数个暂时相邻的图像帧,其中一给定的场景边界系根据输入该视频流中的两个暂时相邻图像帧间的关系而被确定;
确定每一场景的场景形式;以及
根据该场景形式对每一场景进行编码。
2.如权利要求1所述的方法,其中每一场景形式系基于一或多个标准而被确定,该一或多个标准包括:
位于该输入视频流的时间轴上的一给定场景位置;
该给定场景的一长度;
该给定场景中的一运动判断;
从一先前场景与该给定场景中的一有效差值;
该给定场景的一光谱数据大小;
该给定场景的一光学特征识别;或
该给定场景的一剧本结构信息。
3.如权利要求1所述的方法,其中该场景形式的决定进一步包括利用面部识别。
4.如权利要求2所述的方法,其中该剧本结构信息包括一相对注意参数,其中该相对注意参数近似估计一观众注意的相对量的一预定估计,该预定估计可预期地被用于包括给定场景的该输入视频流的一视频片段。
5.如权利要求2所述的方法,其中剧本结构信息进一步包括一或多项:
一时间范围定义;
来自该给定场景的一文件信息;
与该给定场景相关的一音频内容;
与该给定场景相关的一结束字幕信息;或
与该给定的场景相关的一元数据。
6.如权利要求1所述的方法,其中一给定场景形式包括一或多项:
一快进;
一静止;
一头部特写;
一文件;
一大多是黑色的图像;
一短场景;
一滚动演职员名单;
一标题场景;
一杂项;或
一默认值。
7.如权利要求1所述的方法,进一步包括:确定一第一图像帧在当该第一图像帧在该输入视频流的时间轴上具有至少一相邻于一第二图像帧的位置时,该第一图像帧是与该第二图像帧暂时相邻的。
8.如权利要求1所述的方法,其中确定输入视频流中的两个暂时相邻图像帧的关系的步骤包括:
缩放每个图像帧的一或多个高频元素;
消除每个图像帧的一或多个高频元素;
分析图像帧以确定暂时相邻的图像帧之间的一差值,其中一分数基于该差值被计算;以及
当该分数超出一默认限制时,确定图像帧之间的无关程度,其中该默认限制分数是在一场景发生变化处的一阈值。
9.如权利要求8所述的方法,其中该差值是由一递归滤波器或一自适应滤波器所追踪。
10.如权利要求1所述的方法,其中该预定编码器参数包括一或多个:
一运动判断范围搜索;
一分块数量因素;
一量化器;或
一参照帧号。
11.一种利用场景形式编码视频流的方法,每个场景形式有一或多个复数个编码器参数的一预定义集,该编码器参数被一视频编码器用于对任何给定场景形式进行编码,该方法包括:
接收一输入视频流;
接收场景边界信息,该场景边界信息指示该输入视频流中场景转换发生的位置,其中一场景转换基于输入视频流中两个暂时相邻图像帧的关系而被确定;
基于场景边界信息将输入视频流分成多个场景,每一场景包括多个暂时相邻图像帧;
确定每一场景的场景形式;以及
根据该场景形式对每一场景进行编码。
12.如权利要求11所述的方法,其中每一场景形式系基于一或多个标准而被确定,该一或多个标准包括:
位于该输入视频流的时间轴上的一给定场景位置;
该给定场景的一长度;
该给定场景中的一运动判断;
从一先前场景与该给定场景中的一有效差值;
该给定场景的光谱数据大小;
该给定场景的光学特征识别;或
该给定场景的剧本结构信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾艾欧有限公司,未经艾艾欧有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280015696.4/1.html,转载请声明来源钻瓜专利网。