[发明专利]基于质量元数据的视频分类器构造方法无效

申请号：	201310287917.X	申请日：	2013-07-10
公开（公告）号：	CN103336832A	公开（公告）日：	2013-10-02
发明（设计）人：	吴偶;胡卫明;游强	申请（专利权）人：	中国科学院自动化研究所
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	中科专利商标代理有限责任公司 11021	代理人：	吕雁葭
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于质量数据视频分类构造方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及计算机应用技术领域，特别涉及一种基于质量元数据的视频分类器构造方法。

背景技术

图片、视频及音频等多媒体已经逐渐成为信息传播所采取的主要方式之一。而在这些多媒体信息中，视频由于其内容丰富、动态性强等特点而被越来越多的人使用。然而，由于视频信息包含的数据量大，内容庞杂，因此难以从大量视频中识别出属于特定类别的视频，从而实现高效的信息分类和监管。因此，需要有效的视频识别技术以解决这一问题。

现有的视频识别技术主要通过构造分类器来对视频进行分类。构造分类器的方法主要有两种：(1)基于单模态特征的分类器构造方法。这类方法主要是提取视频的视觉或听觉特征，根据这些特征来构造分类器。(2)基于多模态特征融合的分类器构造方法，这类方法主要是提取视频的多个模态的特征，将其融合以构造分类器。例如，除了视觉特征外，还可以提取音频特征等。有些方法还考虑网络视频周围的文本，从这些文本里面继续提取一些特征用于融合。大量研究与实践表明基于多模态特征融合构造的分类器的性能要优于基于单模态特征构造的分类器。但是，视频数据通常比较复杂，从文本、视觉以及音频这三个模态来看，有些视频周围的文本很丰富，而有的很少；有的视频的视觉质量很高，而有的很低；有的视频的音频信号非常清晰，有的则噪声很大。从质量不好的模态提取的特征由于可靠性不高而通常无法真实地反映视频的特性。目前的基于多模态特征构造分类器的方法均没有考虑到特征质量的问题，导致无法实现准确的视频识别。

发明内容

有鉴于此，本发明的主要目的是提供一种基于质量元数据的视频分类器构造方法。

根据本发明的一个方面提供了一种基于质量元数据的视频分类器构造方法，包括：提取视频样本集中每个视频样本的视频特征，以得到视频特征集；对每个视频样本赋予标签，以表示该视频样本属于第一类别或第二类别；针对每个视频样本进行质量评估以得到该视频样本的质量元数据，所有视频样本的质量元数据组成质量元数据集；通过对质量元数据集进行聚类，将视频特征集分成多个视频特征子集；以及针对每个视频特征子集，基于属于该视频特征子集的视频特征和相应视频样本的标签，利用基于聚类的多任务学习算法得到对应于该视频特征子集的视频分类器。

根据本发明的方法根据视频的各个模态(视觉、音频以及文本)信息所呈现的质量不均衡的实际特点来将视频样本集合分为不同子集，对每个子集分别构造分类器，对于待分类视频，根据其质量元数据对应的子集来调用相应的分类器以进行分类，从而实现优化的分类效果。

此外，本发明通过基于聚类的多任务学习方法来构造分类器，既能够针对不同质量的视频样本子集构造不同的分类器，又能够避免使用单一视频样本子集时训练样本规模较小的问题。

附图说明

图1示意性示出了根据本发明实施例的基于质量元数据的视频分类器构造方法的流程图；以及

图2示意性示出了根据本发明实施例的视频分类方法的工作过程。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

本发明的执行环境采用一台具有3.0G赫兹中央处理器和2G字节内存的奔腾4计算机并用C++语言编制了视频分类器构造程序，实现了本发明的基于质量元数据的视频分类器构造方法，还可以采用其他执行环境实现本发明，在此不再赘述。

图1示出了根据本发明实施例的基于质量元数据的视频分类器构造方法的流程图，其步骤如下：

在步骤101，提取视频样本集中每个视频样本的视频特征，以得到视频特征集。可选地，每个视频样本包括视频以及该视频周围的文本。可以利用计算机收集网络视频以及每个网络视频周围的文本以构成网络视频样本集。也可以通过其他方式提供该视频样本集。

根据本发明的实施例，视频特征可以包括视觉特征、音频特征和文本特征。关于具体选取哪些特征，主要依据视频的具体类别来定。下面分别以暴力视频和色情视频为例来说明提取哪些特征。

根据本发明的实施例，对于暴力视频的识别，在视觉特征提取上，主要提取能体现暴力内容的特征，例如运动矢量、颜色、纹理、形状等。在音频特征提取上，主要提取和暴力相关的音频特征，例如短时能量，过零率，基音周期等。在文本特征提取上，主要利用常规的文本特征提取算法，如文档频率，信息增益以及互信息等方法来提取。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所，未经中国科学院自动化研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310287917.X/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于质量元数据的视频分类器构造方法无效

专利文献下载