[发明专利]一种视频场景聚类及浏览方法有效

专利信息
申请号: 201310317750.7 申请日: 2013-07-26
公开(公告)号: CN103440640A 公开(公告)日: 2013-12-11
发明(设计)人: 张磊;徐千昆;黄华 申请(专利权)人: 北京理工大学
主分类号: G06T7/00 分类号: G06T7/00;G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种视频场景聚类及浏览方法,包括以下步骤:镜头边界检测与分割;镜头关键帧提取;镜头间相似度计算;镜头聚类;场景聚类;场景图表示。本发明使用场景聚类,从而得到视频场景层次的内容图结构,获得了基于场景的视频的高层语义信息;并使用二维图结构表述视频结构,为用户提供了一种有引导的非线性视频浏览方式,提高了浏览效率。
搜索关键词: 一种 视频 场景 浏览 方法
【主权项】:
1.一种视频场景聚类方法,该方法包括以下步骤:步骤一、镜头边界检测与分割;读取视频,检测视频中的切变和渐变镜头边界,根据所得镜头边界,将视频分割为多个独立的镜头;步骤二、镜头关键帧提取对于独立的镜头,使用光流法检测视频内容变化,当视频帧内对象运动的距离达到一定阈值时,提取关键帧,得到代表镜头的关键帧集合,所述阈值为视频帧长宽的百分比Tflow;步骤三、镜头间相似度计算对于镜头中提取的关键帧进行SIFT特征点提取,在所有镜头的关键帧集合之间进行关键帧的SIFT特征点匹配,根据匹配特征点数量定义镜头之间相似度,相似度定义如下:Sa,b=-1/Σk=1NaΣh=1Nbc(mak,mbh)Na×Nb]]>其中Sa,b是镜头a、b之间的相似度,Na、Nb分别表示镜头a、b的关键帧集合中关键帧图像的数量,是镜头a中第k个关键帧图像,是镜头b的第h个关键帧图像,是两幅图像之间SIFT特征点匹配的数量,若小于特定阈值Tnum,则设置为0;步骤四、镜头聚类根据上一步获得的镜头之间的相似度,使用信息传递聚类算法对镜头进行聚类,得到若干聚类中心,根据每个镜头所属的聚类中心不同,将所有镜头分为若干个镜头集合,每个集合属于一个镜头类别;在信息传递聚类中镜头自身相似度定义为:Sa,a=1NsΣabSa,b]]>Ns表示全部已有相似度的数量,即将镜头自身相似度Sa,a设置为全部非自身相似度的均值;步骤五、场景聚类根据镜头聚类结果,将在一定窗口Twin即连续Twin个镜头内连续出现切换的镜头类别合并为一类,定义不同镜头类别之间的相似关系如下:S(i,k)=-1/f(i,k)S(i,k)是镜头类别i,k之间的相似度,f(i,k)是镜头类别i,k之间的切换次数,令镜头类别自身相似度值为S1,使用信息传递聚类算法对镜头类别进行聚类,得到初步的场景聚类结果;令镜头类别自身相似度值为S2,以初步的场景聚类结果为输入,重复本步骤上述操作,得到最终的场景聚类结果,其中S1和S2为用户设置的整数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310317750.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top