[发明专利]对视频中的运动矢量进行可靠性分类的方法和系统无效
申请号: | 200910119520.3 | 申请日: | 2009-03-12 |
公开(公告)号: | CN101833768A | 公开(公告)日: | 2010-09-15 |
发明(设计)人: | 韩博;吴伟国;陈正华 | 申请(专利权)人: | 索尼株式会社 |
主分类号: | G06T7/20 | 分类号: | G06T7/20;H04N7/26 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 周少杰 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 中的 运动 矢量 进行 可靠性 分类 方法 系统 | ||
技术领域
本申请涉及视频(运动图像)的处理/分析。具体地说,本申请涉及一种对视频中的运动矢量进行可靠性分类的方法和系统,用于将从视频中提取出的运动信息(在本申请中指运动矢量)根据其可靠性进行分类。
背景技术
从视频数据中提取的某一图像区域的运动信息,是视频的处理/分析中所普遍采用的一种重要特征,人们希望这类信息能够较准确地反映视频中的目标的运动。然而,视频中若干像素点的集合并不一定是在空间中唯一、在时间上一成不变的。因此,通过已有方法获得的运动信息中就只有部分是可靠的,能反映视频目标的真实运动;而那些不可靠的运动信息则会给视频的处理/分析带来负面影响。所谓可靠指的是该运动准确地描述了该区域所对应的物理目标(或者卡通中对应的假想物理目标)在视频的不同帧间的位置变化。
现有的有效的运动矢量搜索方法(以搜索范围足够大的全搜索为例),搜索结果主要为可靠和不可靠两种情况。现有的对视频中的运动矢量进行可靠性评价的技术主要采用三类信息:图像区域的纹理特征、图像区域匹配的误差特征和不同区域间的相关性信息。但现有的各种技术在应用中仍存在不足之处。
发明内容
为了弥补现有技术在应用中的不足,达到辨识不可靠的运动矢量或者提取相应的可靠运动矢量的目的,本申请提出了一种新的、更加有效的运动矢量可靠性分类方法。
在实现本发明的一个实施方式中,提供一种对视频中的运动矢量进行可靠性分类的方法,包括:分块和搜索步骤,用于将输入视频的指定视频帧分块,并且对所述指定视频帧的指定块搜索运动矢量以便对所述指定块生成块匹配误差;纹理特征提取步骤,用于提取所述指定块的纹理特征;以及按块分类步骤,用于根据所述指定块的所述块匹配误差和纹理特征,对所述指定块进行运动矢量可靠性分类,将运动矢量分为可靠、误匹配、多匹配三类。
在实现本发明的另一个实施方式中,提供一种对视频中的运动矢量进行可靠性分类的系统,包括:分块和搜索模块,用于将输入视频的指定视频帧分块,并且对所述指定视频帧的指定块搜索运动矢量以便对所述指定块生成块匹配误差;纹理特征提取模块,用于提取所述指定块的纹理特征;以及按块分类模块,用于根据所述指定块的所述块匹配误差和纹理特征,对所述指定块进行运动矢量可靠性分类,将运动矢量分为可靠、误匹配、多匹配三类。
在实现本发明的另一个实施方式中,提供一种对视频中的运动矢量进行可靠性分类的方法,包括:按块分类步骤,用于对将输入视频的指定视频帧分块得到的各块进行运动矢量可靠性分类;以及按帧分类步骤,用于根据所述指定视频帧内的各块的运动矢量可靠性分类,在所述指定视频帧内进行运动矢量可靠性分类优化,以便获得所述指定视频帧内各块的运动矢量的最优分类。
在实现本发明的另一个实施方式中,提供一种对视频中的运动矢量进行可靠性分类的系统,包括:按块分类模块,用于对将输入视频的指定视频帧分块得到的各块进行运动矢量可靠性分类;以及按帧分类模块,用于根据所述指定视频帧内的各块的运动矢量可靠性分类,在所述指定视频帧内进行运动矢量可靠性分类优化,以便获得所述指定视频帧内各块的运动矢量的最优分类。
在本发明的一个实施方式中,根据造成运动矢量不可靠的原因把不可靠运动矢量分为误匹配和多匹配;这一分类方法引入的运动矢量的误匹配和多匹配矢量在一些应用(例如视频镜头转换检测)中提升了系统的性能。
在本发明的另一个实施方式中,利用了视频图像中相邻区域之间运动矢量的相关性,提高了视频运动矢量可靠性分类的正确率。
在本发明的另一个实施方式中,利用了统计方法对整个帧的运动矢量可靠性分类结果进行优化,获得整个帧的全局最优结果,从而提高了视频运动矢量可靠性分类的正确率。
在本发明的另一个实施方式中,融合并改进了图像块匹配误差和图像块内部纹理强度两种矢量作为基本特征,并且通过利用图像中相邻块之间运动矢量的相关性得到运动矢量分类的全局最优结果。这使得运动矢量分类结果达到很高的正确率,例如,对误匹配运动矢量,该实施方式的查全率(Recall,即本发明搜索到符合条件的运动矢量数量占符合该条件实际运动矢量数量的比率)和查准率(Precision,即,对于本发明搜索到符合条件的运动矢量,本发明得到的运动矢量可靠性分类与实际的运动矢量可靠性分类一致的比率)均可达到97%以上,对可靠运动矢量和多匹配运动矢量,查全率和查准率均可超过或接近90%。更高正确率的可靠性分类结果自然可以在一些应用(例如视频全局运动估计)中进一步提升系统的性能。
附图说明
图1图示了根据本发明的一个实施方式的方法的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社,未经索尼株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910119520.3/2.html,转载请声明来源钻瓜专利网。