[发明专利]一种基于服务模拟交互的视频内容获取方法及系统有效
申请号: | 201210505518.1 | 申请日: | 2012-11-30 |
公开(公告)号: | CN103856827A | 公开(公告)日: | 2014-06-11 |
发明(设计)人: | 申继龙;苗光胜;牛温佳;唐晖;慈松;谭红艳 | 申请(专利权)人: | 中国科学院声学研究所;华数传媒网络有限公司 |
主分类号: | H04N21/4782 | 分类号: | H04N21/4782;H04N21/858;H04N21/8545 |
代理公司: | 北京法思腾知识产权代理有限公司 11318 | 代理人: | 杨小蓉;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 服务 模拟 交互 视频 内容 获取 方法 系统 | ||
技术领域
本发明属于网络新媒体技术领域,特别涉及到视频网站内容获取的方法,具体涉及一种基于服务模拟交互的视频内容获取方法及系统。
背景技术
网络媒体的迅速发展,影响了相应的延伸媒体,而视频网站依附网络这一快速、便捷手段,迅速发展,成为了网民的不可或缺的部分。视频网站的优势主要在视频内容分享上满足网民的多样需求。视频内容的分享为人们提供了信息存储空间和发布平台,人们可以在线观看和视频下载。
浏览器和Web服务器之间使用的主要是HTTP协议,HTTP是互联网上应用最广泛的协议,能够将超文本标记语言(HTML)文档从Web服务器传送到浏览器。HTML始终用于创建文档的标记语言,这些文档包含了相关信息的链接。HTTP因其简捷、快速的方式,适用于分布式超媒体信息系统。
当今的各大视频网站的最终视频的下载地址基本上不会出现在原始的html文件中,若要下载视频,必须注册视频网站的账号或者安装播放器,由于这个原因,使批量下载视频变得不可能。当通过浏览器请求视频的播放页面时,浏览器和Web服务器使用HTTP协议互相传送了很多消息,虽然视频的下载地址包含在这些消息中,但是如何找到有效的信息是一个关键问题。因此寻找一种能够解析出视频下载地址的方法势在必行。
发明内容
本发明的目的在于,为克服上述问题本发明提供一种基于服务模拟交互的视频内容获取方法及系统。
为了实现上述目的,本发明提供了一种基于服务模拟交互的视频内容获取方法,该方法通过模拟浏览器和Web服务器交互得到视频的下载地址,所述方法包含:
步骤101)模拟浏览器通过视频播放页面的html文件,取得视频的ID号;
步骤102)模拟浏览器根据视频的ID号组装请求视频播放列表的url,向Web服务器发送http请求得到该Web服务器反馈的播放列表文件;
步骤103)模拟浏览器从url播放列表中提取出视频的清晰度信息,拼成视频播放列表的url,再次向Web服务器发送http请求,得到视频播放列表的文件;
步骤104)模拟浏览器从视频播放列表文件中提取相关信息,拼接成视频的下载地址。
上述步骤101)之前还包含如下步骤:
模拟浏览器提取视频播放url中的主机IP地址和主机资源的具体地址,将上述两个地址填写到请求报文头里,向Web视频服务器发送http请求,得到一个视频播放页面的html文件。
上述视频播放列表的文件中的相关信息包含:视频文件各个分片的大小、视频分片的总数或视频的播放时长。
上述步骤104)进一步包含:
模拟浏览器直接从视频播放列表文件中提取视频下载地址;或
模拟浏览器将提取出来的下载地址向Web服务器发送请求,得到重定向后的最终下载地址。
所述浏览器和Web服务器使用http协议通信,浏览器发送http请求,得到一个或多个Web服务器返回的响应。
基于上述方法本发明还提供了一种基于服务模拟交互的视频内容获取系统,该系统通过模拟浏览器和Web服务器交互得到视频的下载地址,所述系统包含:
视频ID号获取模块,用于通过视频播放页面的html文件,取得视频的ID号;
第一播放列表获取模块,用于根据视频的ID号组装请求视频播放列表的url,向Web服务器发送http请求得到该Web服务器反馈的播放列表文件;
第二播放列表获取模块,用于从url播放列表中提取出视频相关信息,拼成视频播放列表的url,再次向Web服务器发送http请求,得到视频播放列表的文件;和
下载地址提取模块,用于从视频播放列表文件中提取相关信息,拼接成视频的下载地址。
上述系统还包含:
视频播放页面的html文件获取模块,用于提取视频播放url中的主机IP地址和主机资源的具体地址,将上述两个地址填写到请求报文头里,向Web视频服务器发送http请求,得到一个视频播放页面的html文件。
上述视频播放列表的文件中的相关信息包含:视频文件各个分片的大小、视频分片的总数或视频的播放时长。
上述下载地址提取模块进一步包含:
第一提取子模块,用于直接从视频播放列表文件中提取视频下载地址;
第二提取子模块,用于将提取出来的下载地址向Web服务器发送请求,得到重定向后的最终下载地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;华数传媒网络有限公司,未经中国科学院声学研究所;华数传媒网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210505518.1/2.html,转载请声明来源钻瓜专利网。