[发明专利]视频聚类方法及检测方法在审
申请号: | 201310202454.2 | 申请日: | 2013-05-27 |
公开(公告)号: | CN104182421A | 公开(公告)日: | 2014-12-03 |
发明(设计)人: | 吕钊;杨东强 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 隆天国际知识产权代理有限公司 72003 | 代理人: | 黄嵩泉;吕俊清 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 方法 检测 | ||
技术领域
涉及多媒体处理领域及信息处理领域,具体地说是话题检测与跟踪技术中的视频话题检测与跟踪技术。
背景技术
话题检测与跟踪是一项面向多媒体信息流进行未知话题探测和已知话题跟踪的信息处理技术。视频话题检测与跟踪希望将大量视频中同一话题的视频自动聚类,实现按话题查找、组织和利用来自多种媒体的信息,提高用户的检索效率。由于话题检测与跟踪相对于信息检索、信息挖掘和信息抽取等自然语言处理技术具备很多共性,并面向大规模视频语料,是当前多媒体处理领域的研究热点之一。网络视频主要包括文本特征和视觉特征两方面。然而由于网络视频内容主要由非专业人士进行拍摄整理,视频质量良莠不齐,网络视频的话题检测与跟踪还存在微博视频文本信息稀疏、存在噪声、视觉特征质量不高、话题漂移等问题。
现有的话题检测与跟踪方法主要应用于新闻领域,且针对文本特征的话题检测与跟踪较为成熟。在话题检测领域中,如向量空间模型、语言概率模型的应用较为广泛。其中向量空间模型较为直接常用,但是模型忽略视频对象各特征之间的关联关系。概率语言模型具有一定的理论基础,但是容易引入噪声。在多维度特征融合的模型中,向量空间模型亦可添加相应的视觉特征,通过抽取底层视觉近邻副本结合文本特征,构成多维度的视频话题模型。另外,亦有采取图模型对话题特征进行表示,但其应用尚属探索阶段,可以进行进一步的研究。话题跟踪领域主要有基于查询、分类、聚类等方法,另外在话题跟踪过程中又可分为话题模型可调节与话题模型不可调节两大类方法。
发明内容
本发明提供一种生成最优关系簇网路的视频聚类方法,其特征在于,包括:a.获取待聚类视频的集合,并进一步获取与每个所述待聚类视频相适应的文本信息;b.对每个所述待聚类视频,抽取视频特征,所述文本特征以及所述视觉特征组成所述待聚类视频的视频特征,其中,所述抽取视频特征包括:对所述待聚类视频的文本信息进行数据处理并抽取相应的文本特征;对所述待聚类视频的视频数据进行分割并抽取所述待聚类视频的视觉特征;c.根据所述待聚类视频的集合及其视频特征构造一N分图;d.对所述待聚类视频的集合进行初始化聚类以获得初始的视频聚类以及初始的视频特征聚类,将初始化聚类获得的聚类中心添加到所述N分图中,作为隐藏结点,计算所述视频聚类与所述视频特征聚类之间的权重矩阵并形成初始的关系簇网络;e.迭代更新所述文本特征、所述视频聚类、所述视频特征聚类以及所述关系簇网络,当此次迭代更新的关系簇网络与所述N分图的距离小于第一阈值时,则停止迭代以获得最优关系簇网络;以及f.根据获得的最优关系簇网络进行聚类跟踪或视频检测,其中,所述聚类跟踪包括:输入一视频特征,并与所述最优关系簇网络的视频特征聚类进行匹配,以获取属于与所述视频特征相适应的视频特征聚类的视频的集合;所述视频检测包括:输入一视频,根据所述视频的文本特征与视觉特征与所述最优关系簇网络进行匹配和聚类以获得所述视频所属的视频特征聚类。
优选地,所述抽取所述文本信息的文本特征包括:对所述文本信息进行分词;利用词频-逆向文件频率加权法计算所述文本信息分词后每个词的文本权重;以及将文本权重不小于第二阈值的词作为所述文本信息的关键词,其中,所述文本信息的文本特征包括所述关键词以及相应的文本权重。
优选地,所述文本权重根据如下公式计算并更新:
TFIDFt=TFt*log(N/DFt),
其中,TFIDFt为词t的文本权重,N表示全部视频聚类的个数,DFt表示包含词t的视频聚类的个数,TFt是词t在与所述文本信息相适应的待聚类视频所属的视频聚类中出现的频数,
其中,利用K-means聚类方法对所述待聚类视频进行初始聚类以初始化所述文本权重。
优选地,所述抽取所述待聚类视频的视觉特征包括:分割所述待聚类视频的镜头,获取所述镜头变换的视频帧;通过K-means聚类方法对所述视频帧根据颜色灰度值进行迭代聚类以获取第一个数个关键帧,所述视觉特征包括所述关键帧以及相适应的16维灰度值表示,其中,所述第一个数根据贝叶斯信息准则确定。
优选地,所述N分图根据如下模型构造:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学;,未经华东师范大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310202454.2/2.html,转载请声明来源钻瓜专利网。