[发明专利]一种基于关键帧的网络视频格式文件摘要提取方法在审
申请号: | 201410147819.0 | 申请日: | 2014-04-14 |
公开(公告)号: | CN104978364A | 公开(公告)日: | 2015-10-14 |
发明(设计)人: | 张军;宋惟忠 | 申请(专利权)人: | 上海京知信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200060 上海市普*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键 网络 视频 格式文件 摘要 提取 方法 | ||
技术领域
本发明涉及一种基于关键帧的网络视频格式文件摘要提取方法
背景技术
目前网络爬虫只爬取文本,不能爬取音乐、图片和视频等多媒体文件,原因主要是多媒体数据量巨大;如何下载传输多媒体文件;如何索引多媒体文件;进而对处理过的多媒体文件进行检索。现在因特网上有大量的多媒体文件,特别是社交网站和多媒体分享的兴起,需要对多媒体文件进行精准检索。
网络爬虫,也称网络蜘蛛、网络机器人,是一个自动提取网页的程序,它从因特网上下载网页,是搜索引擎的重要组成部分。网络爬虫利用标准的HTTP协议,根据超级链接和Web文档检索的方法遍历因特网信息空间。
因特网上有数千种不同的数据类型,HTTP给每种要通过Web传输的对象都打上了名为MIME类型的数据格式标签(常见视频格式:video/MP4V-ES,video/mpeg,video/quicktime,video/vnd.mpegurl,video/x-msvideo)。统一资源定位符(URL)是资源标识符最常见的形式。URL描述了一台特定服务器上某资源的特定位置。
UDP是OSI参考模型中一种无连接的传输层协议,它主要用于不要求分组顺序到达的传输中,分组传输顺序的检查与排序由应用层完成,提供面向事务的简单不可靠信息传送服务。网络视频可通过UDP进行下载,因为UDP具有TCP所望尘莫及的速度优势。
本发明提供了一种基于关键帧的网络视频格式文件摘要提取方法,可在适当增加数据量的前提下,通过URL确定网络视频格式文件的地址,利用UDP协议缓存下载网络视频格式文件,将视频序列切分为若干镜头,然后从镜头中提取关键帧,最终形成网络视频格式文件摘要。
发明内容
本发明的目的在于提供一种基于关键帧的网络视频格式文件摘要提取方法。本发明包括以下特征:
发明技术方案
一种基于关键帧的网络视频格式文件摘要提取方法,其具体步骤如下:
1)通过URL确定网络视频格式文件的地址;
2)利用UDP协议缓存下载网络视频格式文件;
3)将视频序列切分为若干镜头,再从每个镜头中按均匀时间间隔提取3个关键帧;
4)基于关键帧之间的差异计算镜头之间的距离矩阵,然后采用层次汇合聚类算法HAC,对镜头进行层次聚类;
5)从每个聚合类中选出时间最长的镜头,将摘要的总时间长度按比例分配给每个选出的镜头,根据分配的时间长度,结合Haar分类器人脸检测对关键帧打分,从每个选出的镜头中找出一个重要连续片段;
6)最终的摘要就是将这些片段按时间顺序进行串接所形成的视频序列。
附图说明
图1是基于关键帧的网络视频格式文件摘要提取流程图。
具体实施方式
这种基于关键帧的网络视频格式文件摘要提取方法,包括如下步骤:
1)通过URL确定网络视频格式文件的地址;
2)利用UDP协议缓存下载网络视频格式文件;
3)将视频序列切分为若干镜头,再从每个镜头中按均匀时间间隔提取3个关键帧;
4)基于关键帧之间的差异计算镜头之间的距离矩阵,然后采用层次汇合聚类算法HAC,对镜头进行层次聚类;
5)从每个聚合类中选出时间最长的镜头,将摘要的总时间长度按比例分配给每个选出的镜头,根据分配的时间长度,结合Haar分类器人脸检测对关键帧打分,从每个选出的镜头中找出一个重要连续片段;
6)最终的摘要就是将这些片段按时间顺序进行串接所形成的视频序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海京知信息科技有限公司,未经上海京知信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410147819.0/2.html,转载请声明来源钻瓜专利网。