[发明专利]一种视频场景聚类及浏览方法有效
申请号: | 201310317750.7 | 申请日: | 2013-07-26 |
公开(公告)号: | CN103440640A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 张磊;徐千昆;黄华 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种视频场景聚类及浏览方法,包括以下步骤:镜头边界检测与分割;镜头关键帧提取;镜头间相似度计算;镜头聚类;场景聚类;场景图表示。本发明使用场景聚类,从而得到视频场景层次的内容图结构,获得了基于场景的视频的高层语义信息;并使用二维图结构表述视频结构,为用户提供了一种有引导的非线性视频浏览方式,提高了浏览效率。 | ||
搜索关键词: | 一种 视频 场景 浏览 方法 | ||
【主权项】:
1.一种视频场景聚类方法,该方法包括以下步骤:步骤一、镜头边界检测与分割;读取视频,检测视频中的切变和渐变镜头边界,根据所得镜头边界,将视频分割为多个独立的镜头;步骤二、镜头关键帧提取对于独立的镜头,使用光流法检测视频内容变化,当视频帧内对象运动的距离达到一定阈值时,提取关键帧,得到代表镜头的关键帧集合,所述阈值为视频帧长宽的百分比Tflow;步骤三、镜头间相似度计算对于镜头中提取的关键帧进行SIFT特征点提取,在所有镜头的关键帧集合之间进行关键帧的SIFT特征点匹配,根据匹配特征点数量定义镜头之间相似度,相似度定义如下:S a , b = - 1 / Σ k = 1 N a Σ h = 1 N b c ( m a k , m b h ) N a × N b ]]> 其中Sa,b是镜头a、b之间的相似度,Na、Nb分别表示镜头a、b的关键帧集合中关键帧图像的数量,是镜头a中第k个关键帧图像,是镜头b的第h个关键帧图像,是两幅图像之间SIFT特征点匹配的数量,若小于特定阈值Tnum,则设置为0;步骤四、镜头聚类根据上一步获得的镜头之间的相似度,使用信息传递聚类算法对镜头进行聚类,得到若干聚类中心,根据每个镜头所属的聚类中心不同,将所有镜头分为若干个镜头集合,每个集合属于一个镜头类别;在信息传递聚类中镜头自身相似度定义为:S a , a = 1 N s Σ a ≠ b S a , b ]]> Ns表示全部已有相似度的数量,即将镜头自身相似度Sa,a设置为全部非自身相似度的均值;步骤五、场景聚类根据镜头聚类结果,将在一定窗口Twin即连续Twin个镜头内连续出现切换的镜头类别合并为一类,定义不同镜头类别之间的相似关系如下:S(i,k)=-1/f(i,k)S(i,k)是镜头类别i,k之间的相似度,f(i,k)是镜头类别i,k之间的切换次数,令镜头类别自身相似度值为S1,使用信息传递聚类算法对镜头类别进行聚类,得到初步的场景聚类结果;令镜头类别自身相似度值为S2,以初步的场景聚类结果为输入,重复本步骤上述操作,得到最终的场景聚类结果,其中S1和S2为用户设置的整数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310317750.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种防触电插座
- 下一篇:采油用球形空气包及其空气包材质