[发明专利]基于组稀疏编码的单个非结构化视频的可扩展缩略的方法有效

专利信息
申请号: 201910003111.0 申请日: 2019-01-03
公开(公告)号: CN109905778B 公开(公告)日: 2021-12-03
发明(设计)人: 李凯;管民皇;马然;沈礼权;安平 申请(专利权)人: 上海大学
主分类号: H04N21/845 分类号: H04N21/845;H04N21/8549
代理公司: 上海上大专利事务所(普通合伙) 31205 代理人: 陆聪明
地址: 200444*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 稀疏 编码 单个 结构 视频 扩展 缩略 方法
【权利要求书】:

1.一种基于组稀疏编码的单个非结构化视频的可扩展缩略的方法,其特征在于,包括以下步骤:

步骤1:输入原始视频,将视频均匀切分为一小组片段,提取每个片段的时空兴趣点,形成相应的向量化表示;

步骤2:选取视频的前n个片段作为视频摘要的一部分,并通过组稀疏编码算法对这n个片段进行重构,获得初始字典和重构系数;

步骤3:用当前字典对下一个片段进行重构并计算重构误差,若误差大于设定阈值,将该片段加入摘要中并更新字典;

步骤4:按照步骤3依次处理每个片段直到结束,获得最终的字典和重构系数;

步骤5:根据步骤4获得的稀疏重构系数,解决整数二次规划问题建立可扩展缩略,方法是:

选择组合在一起的视频小片段时,其相应的稀疏重构系数应满足两个主要特性,是两项准则:

一是稀疏性,重构的系数越稀疏,越接近字典中的原子;

二是可分性,不同视频小片段稀疏表达的原子应尽量不同,从而在整个视频中越具有代表性;

将上述两项准则数字化,由稀疏重构系数构建长度可伸缩的视频缩略表述为下述优化问题:

s.t.1Tb=s,

bi∈{0,1},i∈{1,......,N}

式中,b={b1,......,bn}为是否选取各个视频片段的二元指示符,Ai为第i个视频片段的稀疏重构系数矩阵,N为视频片段的数目,bi=1表示该选取该片段组成最终的视频缩略,等式约束1Tb=s规定了视频缩略的长度为s;式(5)是一个整数二次规划问题,引入松弛变量代替二次项,将式(5)转化为整数线性规划问题进行求解。

2.根据权利要求1所述基于组稀疏编码的单个非结构化视频的可扩展缩略的方法,其特征在于,所述步骤1中的提取每个视频片段的时空兴趣点,形成相应的向量化表示的方法是:

每50帧为一个片段,假设视频被分为k个片段,X表示视频片段,即X={X1,......,Xi,......,Xk};

提取各帧的时空兴趣点,运用HOG,HOF描述子描述时空兴趣点,对其进行PCA降维,得到每个时空兴趣点最终的描述子;

顺序联接各帧的描述子,得到的矩阵为每个片段的向量化表示,片段的向量化表示组成视频的向量化表示,x表示视频片段的HOG,HOF描述子的向量化表示,即x={x1,......,xi,......,xk}。

3.根据权利要求1所述基于组稀疏编码的单个非结构化视频的可扩展缩略的方法,其特征在于,所述步骤2中的通过组稀疏编码算法对前n个片段进行重构的方法是:

前n个片段记为x0={x1,......,xi,......,xn},其中x表示视频片段的HOG,HOF描述子的向量化表示,n小于片段总数k的5%,xi表示第i个片段;设初始字典为D,有m个原子,即D={d1,......,dm};重构系数为A,元素数目对应帧的个数,维度对应字典原子数目,即给定字典,通过交替方向乘子算法优化目标函数,得到每个视频片段的稀疏表达:

式(1)的第一项为重构误差,使字典中的原子线性组合后与原特征接近,第二项为群组稀疏正则项,约束特征向量组仅用到了字典中的一少部分原子进行重构,参数λ是对重构误差和群组稀疏性两个目标的折衷;

通过交替方向乘子算法优化以下目标函数,即得到前n个片段的稀疏表达:

式中,第一项为所有视频片段的重构误差,第二项为字典原子的正则项,η为二者权重系数,n为视频中视频片段的数目,ni为第i个视频片段的特征数目,m为字典的大小;

求出前n个片段的稀疏表达,固定重构系数,通过交替方向乘子算法优化字典,即优化以下目标函数:

使用交替方向乘子算法固定重构系数A求解字典D,固定字典D求解重构系数A,反复迭代500次,得到合适的重构系数A和字典D。

4.根据权利要求1所述基于组稀疏编码的单个非结构化视频的可扩展缩略的方法,其特征在于,所述步骤3中的通过对下一个片段进行重构并计算重构误差,若误差大于设定阈值,将该片段加入摘要中并更新字典的方法是:

对下一个视频片段xi用式(1)的组稀疏编码算法进行重构,其中xi表示第i个视频片段的HOG,HOF描述子的向量化表示,式(1)的第一项为该视频片段的重构误差;如果重构误差大于设定阈值,则当前片段加入到视频摘要中,x表示当前视频摘要片段的HOG,HOF描述子的向量化表示,x0表示前面得到的视频摘要片段的HOG,HOF描述子的向量化表示,即x=x0∪xi

如果当前摘要x含有q个片段,那么更新字典D即求解目标函数:

使用交替方向乘子算法求解这个优化问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910003111.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top