[发明专利]一种静态视频摘要的生成方法及装置在审
申请号: | 201780000556.2 | 申请日: | 2017-01-24 |
公开(公告)号: | CN107223344A | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | 钟圣华;吴嘉欣;黄星胜;江健民 | 申请(专利权)人: | 深圳大学 |
主分类号: | H04N21/8549 | 分类号: | H04N21/8549;G06K9/62 |
代理公司: | 深圳青年人专利商标代理有限公司44350 | 代理人: | 吴桂华 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 静态 视频 摘要 生成 方法 装置 | ||
1.一种静态视频摘要的生成方法,其特征在于,所述方法包括下述步骤:
接收用户输入的待处理视频;
通过奇异值分解算法对所述待处理视频进行预采样,以提取所述待处理视频的候选帧;
根据词袋模型算法,分别生成所述所有候选帧的直方图;
通过基于视频表示的高密度峰值搜索算法对所述所有直方图进行聚类,并获取聚类后的簇中心点;
根据所述每个簇中心点,生成所述待处理视频的静态视频摘要。
2.如权利要求1所述的方法,其特征在于,通过奇异值分解算法对所述待处理视频进行预采样,以提取所述待处理视频的候选帧的步骤,包括:
生成所述待处理视频中每个输入帧的时变特征向量;
根据所述时变特征向量,依次为所述所有输入帧构建特征矩阵,所述每个特征矩阵包含预设窗口大小个、连续的输入帧的时变特征向量;
对所述所有特征矩阵进行奇异值分解,以获取所述每个特征矩阵对应的奇异值矩阵,并根据所述奇异值矩阵,确定所述每个特征矩阵的秩;
依次将相邻的特征矩阵的秩进行比较,当第二特征矩阵的秩大于第一特征矩阵的秩时,将所述第二特征矩阵所对应的最后一个输入帧设置为候选帧,所述第一特征矩阵为所述所有特征矩阵中的任一特征矩阵,所述第二特征矩阵为在所述所有特征矩阵中与所述第一特征矩阵相邻的下一个特征矩阵。
3.如权利要求1所述的方法,其特征在于,根据词袋模型算法,分别生成所述所有候选帧的直方图的步骤,包括:
提取所述所有候选帧的图像特征;
根据所述所有图像特征,通过聚类生成所述每个候选帧的特征码本;
根据所述所有特征码本中的特征分布,生成用于表示所述每个候选帧的直方图。
4.如权利要求1所述的方法,其特征在于,通过基于视频表示的高密度峰值搜索算法对所述所有直方图进行聚类,并获取聚类后的簇中心点的步骤,包括:
根据所述所有直方图,计算所述所有候选帧中每两个候选帧之间的距离;
根据所述每两个候选帧之间的距离和预设的截止距离,计算所述每个候选帧对应的局部密度;
根据所述所有局部密度,计算所述每个候选帧对应的高密度点距离;
根据所述每个候选帧对应的局部密度和高密度点距离,获取所述簇中心点。
5.如权利要求4所述的方法,其特征在于,根据所述每个候选帧对应的局部密度和高密度点距离,获取所述簇中心点的步骤,包括:
根据所述每个候选帧的局部密度和高密度点距离,采用基于加权的峰值搜索聚类策略,计算所述每个候选帧对应的聚类值,所述基于加权的峰值搜索聚类策略的公式为:
γ=α*(ρ*δ)+(1-α)*δ,其中,γ为所述聚类值,α为预设参数,ρ为所述局部密度,δ为所述高密度点距离。
6.如权利要求1所述的方法,其特征在于,根据所述每个簇中心点,生成所述待处理视频的静态视频摘要的步骤,包括:
将所述每个簇中心点的聚类值进行排列,获取所述所有聚类值中增长幅度、或斜率突然大幅度增大的聚类值,并将所述增长幅度、或斜率突然大幅度增大的聚类值设置为阈值;
将所述每个聚类值与所述阈值进行比较,当所述聚类值超过所述阈值时,将所述聚类值所对应簇中心点的候选帧设置为所述静态视频摘要中的视频帧。
7.一种静态视频摘要的生成装置,其特征在于,所述装置包括:
视频接收模块,用于接收用户输入的待处理视频;
候选帧提取模块,用于通过奇异值分解算法对所述待处理视频进行预采样,以提取所述待处理视频的候选帧;
直方图表示模块,用于根据词袋模型算法,分别生成所述所有候选帧的直方图;
聚类运算模块,用于通过基于视频表示的高密度峰值搜索算法对所述所有直方图进行聚类,并获取聚类后的簇中心点;以及
视频摘要生成模块,用于根据所述每个簇中心点,生成所述待处理视频的静态视频摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780000556.2/1.html,转载请声明来源钻瓜专利网。