[发明专利]基于质量元数据的视频分类器构造方法无效
申请号: | 201310287917.X | 申请日: | 2013-07-10 |
公开(公告)号: | CN103336832A | 公开(公告)日: | 2013-10-02 |
发明(设计)人: | 吴偶;胡卫明;游强 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕雁葭 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 质量 数据 视频 分类 构造 方法 | ||
技术领域
本发明涉及计算机应用技术领域,特别涉及一种基于质量元数据的视频分类器构造方法。
背景技术
图片、视频及音频等多媒体已经逐渐成为信息传播所采取的主要方式之一。而在这些多媒体信息中,视频由于其内容丰富、动态性强等特点而被越来越多的人使用。然而,由于视频信息包含的数据量大,内容庞杂,因此难以从大量视频中识别出属于特定类别的视频,从而实现高效的信息分类和监管。因此,需要有效的视频识别技术以解决这一问题。
现有的视频识别技术主要通过构造分类器来对视频进行分类。构造分类器的方法主要有两种:(1)基于单模态特征的分类器构造方法。这类方法主要是提取视频的视觉或听觉特征,根据这些特征来构造分类器。(2)基于多模态特征融合的分类器构造方法,这类方法主要是提取视频的多个模态的特征,将其融合以构造分类器。例如,除了视觉特征外,还可以提取音频特征等。有些方法还考虑网络视频周围的文本,从这些文本里面继续提取一些特征用于融合。大量研究与实践表明基于多模态特征融合构造的分类器的性能要优于基于单模态特征构造的分类器。但是,视频数据通常比较复杂,从文本、视觉以及音频这三个模态来看,有些视频周围的文本很丰富,而有的很少;有的视频的视觉质量很高,而有的很低;有的视频的音频信号非常清晰,有的则噪声很大。从质量不好的模态提取的特征由于可靠性不高而通常无法真实地反映视频的特性。目前的基于多模态特征构造分类器的方法均没有考虑到特征质量的问题,导致无法实现准确的视频识别。
发明内容
有鉴于此,本发明的主要目的是提供一种基于质量元数据的视频分类器构造方法。
根据本发明的一个方面提供了一种基于质量元数据的视频分类器构造方法,包括:提取视频样本集中每个视频样本的视频特征,以得到视频特征集;对每个视频样本赋予标签,以表示该视频样本属于第一类别或第二类别;针对每个视频样本进行质量评估以得到该视频样本的质量元数据,所有视频样本的质量元数据组成质量元数据集;通过对质量元数据集进行聚类,将视频特征集分成多个视频特征子集;以及针对每个视频特征子集,基于属于该视频特征子集的视频特征和相应视频样本的标签,利用基于聚类的多任务学习算法得到对应于该视频特征子集的视频分类器。
根据本发明的方法根据视频的各个模态(视觉、音频以及文本)信息所呈现的质量不均衡的实际特点来将视频样本集合分为不同子集,对每个子集分别构造分类器,对于待分类视频,根据其质量元数据对应的子集来调用相应的分类器以进行分类,从而实现优化的分类效果。
此外,本发明通过基于聚类的多任务学习方法来构造分类器,既能够针对不同质量的视频样本子集构造不同的分类器,又能够避免使用单一视频样本子集时训练样本规模较小的问题。
附图说明
图1示意性示出了根据本发明实施例的基于质量元数据的视频分类器构造方法的流程图;以及
图2示意性示出了根据本发明实施例的视频分类方法的工作过程。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明的执行环境采用一台具有3.0G赫兹中央处理器和2G字节内存的奔腾4计算机并用C++语言编制了视频分类器构造程序,实现了本发明的基于质量元数据的视频分类器构造方法,还可以采用其他执行环境实现本发明,在此不再赘述。
图1示出了根据本发明实施例的基于质量元数据的视频分类器构造方法的流程图,其步骤如下:
在步骤101,提取视频样本集中每个视频样本的视频特征,以得到视频特征集。可选地,每个视频样本包括视频以及该视频周围的文本。可以利用计算机收集网络视频以及每个网络视频周围的文本以构成网络视频样本集。也可以通过其他方式提供该视频样本集。
根据本发明的实施例,视频特征可以包括视觉特征、音频特征和文本特征。关于具体选取哪些特征,主要依据视频的具体类别来定。下面分别以暴力视频和色情视频为例来说明提取哪些特征。
根据本发明的实施例,对于暴力视频的识别,在视觉特征提取上,主要提取能体现暴力内容的特征,例如运动矢量、颜色、纹理、形状等。在音频特征提取上,主要提取和暴力相关的音频特征,例如短时能量,过零率,基音周期等。在文本特征提取上,主要利用常规的文本特征提取算法,如文档频率,信息增益以及互信息等方法来提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310287917.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置