[发明专利]视频序列对齐方法和系统有效
申请号: | 201610986953.9 | 申请日: | 2016-11-09 |
公开(公告)号: | CN106612457B | 公开(公告)日: | 2019-09-03 |
发明(设计)人: | 雷延强 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/845 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 冯右明 |
地址: | 510530 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 序列 对齐 方法 系统 | ||
1.一种视频序列对齐方法,其特征在于,包括以下步骤:
从待对齐的视频序列中抓取无场景切换的视频片段;
分别将所述视频片段中的各个视频帧划分为若干个子块,根据各个视频帧的子块生成视频片段序列;
将所述视频片段序列输入至预先训练的场景类别分类器,分别计算所述视频片段序列属于各个场景类别的概率值,将概率值最大的场景类别设为所述视频片段所属的第一场景类别;
将所述视频片段与预存的原始视频序列中属于所述第一场景类别的视频片段进行对齐。
2.根据权利要求1所述的视频序列对齐方法,其特征在于,在将所述视频序列输入至预先训练的场景类别分类器之前,还包括以下步骤:
获取视频序列样本,将所述视频序列样本按场景划分为多个场景类别;
分别将各个场景类别的视频序列样本划分为若干个样本子块;其中,所述视频序列样本中包括非重叠的样本子块;
根据所述样本子块及其所属的场景类别对深度卷积网络进行训练,得到场景类别分类器。
3.根据权利要求1所述的视频序列对齐方法,其特征在于,还包括以下步骤:
若所述视频片段满足如下条件,判定所述视频片段无场景切换:
式中,f(zi)为第i个视频帧的特征,f(zi-1)为第i-1个视频帧的特征,||·||为距离度量函数,T为预设的距离阈值,n为所述待对齐的视频序列中的视频片段的总数。
4.根据权利要求1所述的视频序列对齐方法,其特征在于,分别计算所述视频片段序列属于各个场景类别的概率值的步骤包括:
根据如下公式计算所述视频片段序列属于各个场景类别的概率值:
式中,表示所述视频片段序列的第i个视频帧中的第k个子块,Yj表示所述原始视频序列中属于第j场景类别的视频片段,为所述视频片段序列中的子块属于第j场景类别的概率值,p(Yj/Z)为所述视频片段序列属于第j场景类别的概率值,K为所述视频片段序列的一个视频帧中子块的总数。
5.根据权利要求1所述的视频序列对齐方法,其特征在于,将所述视频片段与预存的原始视频序列中属于所述第一场景类别的视频片段进行对齐的步骤包括:
根据如下公式将所述视频片段与原始视频序列中属于所述第一场景类别的视频片段进行对齐:
其中,Yj=[yu-n,yu-n+1,…yv+n];
式中,Q表示所述视频片段与原始视频序列的最佳对齐位置,d(·)为距离度量函数,Z为所述视频片段,zi为Z中的第i个视频帧,Yj=[yu,yu+1,…yv]表示所述原始视频序列中属于第j场景类别的视频片段,yi为Yj中的第i个视频帧,yu-i(i=1,2,…,n)为yu前i时刻的视频帧,u用于标识所述原始视频序列中第一个视频帧,yv+i(i=1,2,…,n)为yv后i时刻的视频帧,v用于标识所述原始视频序列中最后一个视频帧,n为正整数,q∈[u-n,v]。
6.一种视频序列对齐系统,其特征在于,包括:
视频抓取模块,用于从待对齐的视频序列中抓取无场景切换的视频片段;
序列生成模块,用于分别将所述视频片段中的各个视频帧划分为若干个子块,根据各个视频帧的子块生成视频片段序列;
计算模块,用于将所述视频片段序列输入至预先训练的场景类别分类器,分别计算所述视频片段序列属于各个场景类别的概率值,将概率值最大的场景类别设为所述视频片段所属的第一场景类别;
对齐模块,用于将所述视频片段与预存的原始视频序列中属于所述第一场景类别的视频片段进行对齐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610986953.9/1.html,转载请声明来源钻瓜专利网。