[发明专利]基于时空关系的互联网视频片段间关系识别方法有效
申请号: | 201310136936.2 | 申请日: | 2013-04-19 |
公开(公告)号: | CN103235806A | 公开(公告)日: | 2013-08-07 |
发明(设计)人: | 黄华;刘洪;张磊 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于时空关系的互联网视频片段间关系识别方法,包括以下步骤:对视频库中的视频片段,检测出其所包含的所有镜头,检测出每个镜头中的每一个关键帧,并描述其颜色特征、轮廓特征和局部极值点个数;基于关键帧的图像特征信息相似性得出两个关键帧之间的相似性,根据关键帧相似性信息计算出镜头之间的相似性,根据镜头间相似性,归纳出视频片段间的关系。本发明为用户提供了一种网络视频库浏览和查询引导的工具,不受外界因素的限制和干扰。该系统能在没有附加条件的指引下快速浏览所有的视频信息,同时以直观的网状关系图展示出视频间的相互关系,引导用户直观而快速地查询所需的内容。 | ||
搜索关键词: | 基于 时空 关系 互联网 视频 片段 识别 方法 | ||
【主权项】:
1.一种基于时空关系的互联网视频片段间关系识别方法,其特征在于,包括以下步骤:步骤一:对视频库C中的视频片段Ci,检测出其所包含的所有镜头
步骤二:对于每个镜头
检测出其关键帧;步骤三:对每个关键帧
用颜色直方图
去描述该关键帧的颜色特征,利用GIST算法求出该关键帧的轮廓特征
利用SIFT算法求出该关键帧的局部极值点个数
步骤四:对于视频库C中任意两个视频片段Ci和Cp,计算其关键帧
和
之间的相似性能量函数![]()
其中,
为颜色直方图的距离,
为GIST特征之间的不一致性,
为SIFT特征之间的不一致性,α、β和γ分别为这三个变量的系数,取值范围为0-1.0;
的定义如下:ω ( f i jk , f p qt ) = - exp ( 1 / max ( m i jk / m p qt , n i jk / n p qt ) ) ]]> 其中,
和
分别表示关键帧
匹配关键帧
时所匹配的特征点个数和关键帧
匹配关键帧
时所匹配的特征点个数;然后,设置一个阈值,根据计算出的关键帧能量函数
的值是否小于这个阈值,判定关键帧
和
是否相似;步骤五:根据关键帧对
和
之间的对应关系,定义镜头Si和Sj间的相似度能量函数为:η ( S i , S j ) = Σ k = 1 T 1 s ( f i jk , σ ( f i jk ) ) + Σ t = 1 T 2 s ( f p qt , σ ( f p qt ) ) ]]> 其中,s(.)为关键帧间相似性能量函数,
和
分别为关键帧
和
所对应的相似关键帧,T1为镜头Si和Sj比对时所找到的相似关键帧对数,T2为镜头Sj和Si比对时所找到的相似关键帧对数;然后,设置一个阈值,根据镜头间的相似度能量函数的值是否小于这个阈值,判定两个镜头间是否相似;步骤六:根据镜头间相似性,得到一个描述该视频片段整体特征信息的相似性序列,归纳出视频片段间是否具有前后、包含结构性关系:对于视频片段对Ci和Cj,如果Ci的前半部分镜头和Cj的后半部分镜头相对应,则Ci在Cj之后;如果Ci的后半部分镜头和Cj的前半部分镜头相对应,则Ci在Cj之前;如果Ci的所有镜头和Cj的中间部分镜头相对应,则Ci包含于Cj之中;如果Ci的中间部分镜头和Cj的所有镜头相对应,则Ci包含Cj;如果具有前后、包含结构性关系,则将视频片段对Ci和Cj之间的关系变量Reij赋值为当前关系,并对它们之间的相似性变量ρij赋一个对应的值;ρij的赋值规则为:
步骤七:设置一个旋转关系阈值,对于镜头间相似性能量函数大于旋转关系阈值但没有结构性关系的视频片段对,判定为同一场景,抽取其中相似的镜头,并利用SFM算法估计拍摄该镜头时的摄像机位置及视角,将视频片段对Ci和Cj之间的关系变量Reij赋值为旋转关系,并对它们之间的相似性变量ρij赋值0.8;步骤八:对于不具有结构性关系也不具有旋转关系的视频片段对Ci和Cj,对关键帧做重要性区域检测,采用基于直方图对比的显著性检测方法分割出每个关键帧
和
的特征区域
和
步骤九:对于视频片段对Ci和Cj中的两个特征区域
和
采用步骤三和步骤四中关键帧相似性对比的方法,对区域
和
进行比对,求出关键帧中特征区域的相似性,将视频片段对Ci和Cj之间的关系变量
赋值为弱关系,并对它们之间的相似性变量ρij赋值:ρ ij = 0.7 * Σ k = 1 K Σ t = 1 T exp ( - s ( R i jk , R p qt ) ) / ( K . T ) ]]> 其中,s(,)为步骤四中定义的相似性能量函数,K和T分别为视频片段Ci和Cj对应的总的关键帧个数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310136936.2/,转载请声明来源钻瓜专利网。
- 上一篇:防滑式试管镊
- 下一篇:用于提供具有电磁干扰屏蔽的增强复合材料的方法和设备