[发明专利]一种静态视频摘要的生成方法及装置在审
申请号: | 201780000556.2 | 申请日: | 2017-01-24 |
公开(公告)号: | CN107223344A | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | 钟圣华;吴嘉欣;黄星胜;江健民 | 申请(专利权)人: | 深圳大学 |
主分类号: | H04N21/8549 | 分类号: | H04N21/8549;G06K9/62 |
代理公司: | 深圳青年人专利商标代理有限公司44350 | 代理人: | 吴桂华 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 静态 视频 摘要 生成 方法 装置 | ||
技术领域
本发明属于计算机技术领域,尤其涉及一种静态视频摘要的生成方法及装置。
背景技术
近年来,随着多媒体技术的发展,在网络上观看自己喜欢的视频已经成为多数人日常生活中不可缺少的一部分,但如何帮助人们从大量的视频中快速获取自己喜欢的、感兴趣的视频,在技术上仍然是一个具有挑战性的问题。静态视频总结是一个有效、经典的解决该问题的方法,该方法通过去除视频中的冗余帧,得到能够简要表示视频内容的静态视频摘要。用户通过观看视频摘要就可以了解到视频的大概内容,并判断是否有兴趣观看整段视频。
目前,相关研究人员已提出了静态视频摘要的多种方法,其中,一种方法将视频分成多个镜头,并基于颜色直方图特征,采用k-均值(k-means)聚类算法将每个镜头的帧分组成簇(预先设置好簇的数量),将每个镜头的聚类中心设置为静态视频摘要结果;另一种方法提出了静态视频摘要的三个步骤,首先,基于颜色和边缘信息对镜头进行边界检测,其次,在聚类过程中根据镜头中的运动类型和场景对镜头进行分类,最后,采用镜头重要滤波器,通过计算运动能量和颜色变化来确定每个镜头的重要性,在镜头拍摄过程中选择每个簇的重要镜头;还有一种方法,先通过消除视频中一些无意义的帧来获得候选帧,再采用k-means聚类方法将所有的候选帧划分为簇(簇的数量有相邻帧之间视觉内容的变化决定),最后在这些簇中过滤一些类似的帧,过滤后剩下的帧被认为是静态视频摘要的结果。
在上述的现有方法中,由于类似的镜头在视频中可能出现多次,所以第一种方法和第二种方法所采用的基于镜头的方式均存在冗余,且第一种方法中预先设置聚类的簇的数量会影响到最佳视频摘要结果的生成,而第三种方法在聚类前的去冗余工作不够深入,仅简单地去除了一些简单的、无意义的视频帧。
发明内容
本发明的目的在于提供一种静态视频摘要的生成方法及装置,旨在解决由于现有技术无法提供一种静态视频摘要生成的有效方法,在生成静态视频摘要时视频中的冗余帧去除程度较低、需人工指定聚类后簇的数量,导致静态视频摘要生成效率较低、生成的静态视频摘要质量不稳定的问题。
一方面,本发明提供了一种静态视频摘要的生成方法,所述方法包括下述步骤:
接收用户输入的待处理视频;
通过奇异值分解算法对所述待处理视频进行预采样,以提取所述待处理视频的候选帧;
根据词袋模型算法,分别生成所述所有候选帧的直方图;
通过基于视频表示的高密度峰值搜索算法对所述所有直方图进行聚类,并获取聚类后的簇中心点;
根据所述每个簇中心点,生成所述待处理视频的静态视频摘要。
另一方面,本发明提供了一种静态视频摘要的生成装置,所述装置包括:
视频接收模块,用于接收用户输入的待处理视频;
候选帧提取模块,用于通过奇异值分解算法对所述待处理视频进行预采样,以提取所述待处理视频的候选帧;
直方图表示模块,用于根据词袋模型算法,分别生成所述所有候选帧的直方图;
聚类运算模块,用于通过基于视频表示的高密度峰值搜索算法对所述所有直方图进行聚类,并获取聚类后的簇中心点;以及
视频摘要生成模块,用于根据所述每个簇中心点,生成所述待处理视频的静态视频摘要。
本发明先采用奇异值分解算法,对待处理视频进行预采样,得到待处理视频的候选帧,再采用词袋模型,生成用来表示这些候选帧的直方图,接着,采用基于视频表示的高密度峰值搜索算法,对所有的直方图进行聚类,最后根据聚类后的每个簇中心点,生成待处理视频的静态视频摘要,从而不仅有效地提高了视频中帧的去冗余效果,且在聚类过程中不需预先设置好簇类中心的数量,能够根据视频的内容自适应地生成一定数量的簇类中心,有效地提高了聚类的稳定性和适应性,降低了聚类的时间复杂度,进而有效地提高了静态视频摘要的生成效率和质量。
附图说明
图1是本发明实施例一提供的静态视频摘要的生成方法的实现流程图;
图2是本发明实施例二提供的静态视频摘要的生成装置的结构示意图;
图3是本发明实施例二提供的静态视频摘要的生成装置中候选帧提取模块的结构示意图;
图4是本发明实施例二提供的静态视频摘要的生成装置中直方图表示模块的结构示意图;
图5是本发明实施例二提供的静态视频摘要的生成装置中聚类运算模块的结构示意图;以及
图6是是本发明实施例二提供的静态视频摘要的生成装置中视频摘要生成模块的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780000556.2/2.html,转载请声明来源钻瓜专利网。