[发明专利]基于YouTuBe的视频批量爬取方法、系统、装置及可存储介质在审
申请号: | 201811458982.3 | 申请日: | 2018-11-30 |
公开(公告)号: | CN109614536A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 马建强 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 陈英俊;袁文婷 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 网页链接地址 可存储 插件 数据采集技术 电子表格 批量下载 下载效率 循环读取 下载 调用 粘贴 | ||
1.一种基于YouTuBe的视频批量爬取方法,应用于电子装置,其特征在于,包括:
将待爬取视频所对应的网页链接地址粘贴在电子表格形成待爬取视频列表;
利用python循环读取所述待爬取视频列表中的网页链接地址,并调用youtube-dl插件和ffmpeg插件以完成所述网页链接地址对应的待爬取视频的批量下载。
2.根据权利要求1所述的基于YouTuBe的视频批量爬取方法,其特征在于,所述调用youtube-dl插件和ffmpeg插件以完成待爬取视频的批量下载的步骤包括:
通过python和youtube-dl插件,获取分辨率最优的待爬取视频;
利用youtube-dl插件和ffmpeg插件对分辨率最优的待爬取视频进行下载。
3.根据权利要求2所述的基于YouTuBe的视频批量爬取方法,其特征在于,所述通过python和youtube-dl插件,获取分辨率最优的待爬取视频的步骤包括:
利用python调取youtube-dl插件以对源头的视频信息进行解析;
利用youtube-dl插件解析出python读取的待爬取视频的视频格式以及与所述视频格式所对应的视频;
利用python选取所述视频所需的视频格式以及文件存储占用量最大的视频,从而获取分辨率最优的视频。
4.根据权利要求2所述的基于YouTuBe的视频批量爬取方法,其特征在于,所述利用youtube-dl插件和ffmpeg插件对分辨率最优的待爬取视频进行下载的步骤包括:
利用youtube-dl插件对获取的分辨率最优的待爬取视频进行下载;
利用ffmpeg插件对所下载的视频进行合成,从而完成视频的批量下载。
5.根据权利要求4所述的基于YouTuBe的视频批量爬取方法,其特征在于,利用youtube-dl插件下载后的爬取视频包括音频和视频画面,并且所述音频和所述视频画面分离;
利用ffmpeg插件对所述音频和所述视频画面进行合成,形成所述音频和视频画面同步的视频。
6.一种基于YouTuBe的视频批量爬取系统,其特征在于,包括:
待爬取视频列表获取单元,用于将待爬取视频所对应的网页链接地址粘贴在电子表格形成待爬取视频列表;
视频批量下载单元,用于利用python循环读取所述待爬取视频列表中的网页链接地址,并调用youtube-dl插件和ffmpeg插件以完成所述网页链接地址对应的待爬取视频的批量下载。
7.根据权利要求6所述的基于YouTuBe的视频批量爬取系统,其特征在于,所述视频批量下载单元包括:
分辨率最优视频获取模块,用于通过python和youtube-dl插件,获取分辨率最优的待爬取视频;
待爬取视频下载模块,用于利用youtube-dl插件和ffmpeg插件对分辨率最优的待爬取视频进行下载。
8.根据权利要求7所述的基于YouTuBe的视频批量爬取系统,其特征在于,所述分辨率最优视频获取模块包括:
插件调取模块,用于利用python调取youtube-dl插件以对源头的视频信息进行解析,
视频信息解析模块,用于利用youtube-dl插件解析出python读取待爬取视频的视频格式以及与所述视频格式所对应的视频;
视频文件选取模块,用于利用python选取所述视频所需的视频格式以及文件存储占用量最大的视频,从而获取分辨率最优的视频。
9.一种电子装置,该电子装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述基于YouTuBe的视频批量爬取方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于YouTuBe的视频批量爬取方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811458982.3/1.html,转载请声明来源钻瓜专利网。