[发明专利]一种基于谱分割理论的镜头聚类方法无效
申请号: | 200810056096.8 | 申请日: | 2008-01-11 |
公开(公告)号: | CN101216886A | 公开(公告)日: | 2008-07-09 |
发明(设计)人: | 薛玲;李超;钟林;李欢;熊璋 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06F17/30 |
代理公司: | 北京科迪生专利代理有限责任公司 | 代理人: | 贾玉忠;卢纪 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分割 理论 镜头 方法 | ||
技术领域
本发明属于视频内容分析与检索领域,具体涉及一种对镜头进行聚类的方法。
背景技术
视频镜头是指语义上不间断的一段视频内容,是视频信息检索的基本结构和语义单元,对这些代表视频语义的单元进行聚类是视频语义分析的基础。当前的聚类算法可以大致分为有监督和无监督两种。有监督聚类通过给定的样本集对分类器进行训练,分类准确,但需要人工标注样本集。无监督聚类算法具有自学习功能,无需训练样本,但面临着最优化分类个数很难确定,分类结果对初始划分较敏感等难题。
近年来,关于镜头聚类方法的研究有很多。目前在视频镜头聚类算法中常用的估计最优化分类个数的方法有以下几种:(1)基于探索模式的评判准则,该方法基于一种合适的信息准则评判标准,遍历所有可能出现的分类个数情况,得到最优化的分类个数;(2)基于融合的估计方法,首先选取一个远大于最优分类个数的分类数进行聚类,聚类的结果根据信息熵最小损失原则相互融合以得到最优的分类个数;(3)基于k-means的迭代聚类,对每个聚类的结果迭代执行k-means算法,采用合适的信息准则判断是否终止,当所有迭代终止时得到最优的分类个数。
第一种方法是最简单的,得到的结果也是最客观的,但是这种方法计算复杂度较高,且在没有先验知识的情况下的搜索范围必须足够大。第二种方法分类过程每次融合后需重新计算融合的信息熵损失,收敛速度慢,计算复杂度高,并且无法对初始分类纠错。第三种方法以X-means为代表,具有收敛速度快,计算复杂度小等优点,但k-means算法只考虑了类间关系,可能会出现将一个类割裂的错误,并且没有针对这种错误的纠错功能。
发明内容
本发明要解决的技术问题:克服现有技术的不足,提供一种基于谱分割理论的镜头聚类方法,该方法可以在低复杂度情况下聚类算法中难以估计最优化的分类个数,利用精确二分类的谱分割,提高了聚类结果的查全率和查准率;提出的全局融合操作,具有对分类错误的纠错功能,避免了局部最优解问题。
本发明的目的是这样实现的:一种基于谱分割理论的镜头聚类方法,包括以下步骤:
(1)对每个待分类的镜头提取其特征向量;
(2)根据提取的特征向量,计算每两类间的相似度;
(3)将镜头集构造为一有权的无向图,根据每两镜头类之间的相似度,使用谱分割将每个镜头类二分为两个镜头类;
(4)用贝叶斯信息准则判定此分割是否有效;有效分割的镜头子类迭代分割操作,无效分割的镜头类为终止节点;
(5)对谱分割最终输出的结果,使用贝叶斯信息准则判断两分类是否连通,根据连通性进行融合,最终得到最优聚类数和聚类结果。
所述步骤(1)中的特征向量的提取采用HSV颜色直方图,并计算整个镜头所有帧的平均颜色直方图作为该镜头的特征向量。
所述步骤(2)中计算每两镜头类之间的相似度计算公式为:
其中eij表示两类镜头i、j之间的相似度,Hi,Hj分别为镜头si,sj颜色直方图,σ为常数。
所述步骤(3)中的方法为:谱分割的结果{A,B}满足下式在全局范围内取得最小值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810056096.8/2.html,转载请声明来源钻瓜专利网。