[发明专利]一种电力信息视频搜索系统有效

专利信息
申请号: 201710572720.9 申请日: 2017-07-14
公开(公告)号: CN107301245B 公开(公告)日: 2020-03-06
发明(设计)人: 徐胜朋;于桂波;王会诚;梁斌;黄传启;蔡忠超;刘文钊 申请(专利权)人: 国网山东省电力公司淄博供电公司
主分类号: G06F16/783 分类号: G06F16/783;G06F16/738;G06F16/71;G06K9/00;G06K9/46;G06K9/62
代理公司: 济南智圆行方专利代理事务所(普通合伙企业) 37231 代理人: 张玉琳
地址: 255095 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 电力 信息 视频 搜索 系统
【权利要求书】:

1.一种电力信息视频搜索系统,包括获取装置、处理装置、分类装置和检索装置,

获取装置,包括网页分析模块、视频文本库、视频地址提取模块以及视频下载器,网页分析模块用于获取视频播放地址的链接并通过HTML文本解析出视频的文字信息,视频文本库用于存储视频的文字信息,视频地址提取模块用于获取视频的真实下载地址,视频下载器通过视频资源切分的方法对视频进行下载;

处理装置,包括视频标准化模块、视频库以及视频特征提取模块,视频标准化模块用于将视频下载器下载的视频进行格式转换,形成具有统一格式的标准视频,视频特征提取模块将标准视频进行结构化处理并获取标准视频的结构特征以及关键帧,视频库用于将标准视频及其结构特征、关键帧对应的进行存储;

分类装置,包括分类模块以及分类视频库,分类模块根据视频文本库以及视频库中信息进行聚类分析,分类视频库将聚类分析后视频以及相关信息按照聚类结构进行存储,从而形成检索数据库;

检索装置,包括检索界面和查询模块,用户通过检索界面输入图像以及检索信息并将检索结果显示在检索界面上以返回给用户,

其特征在于:

根据抓取范围,网页分析模块获取各个视频网站内有视频播放地址的链接,分析该链接对应的HTML文本,解析提取出与视频有关的文字信息,将这些文字信息进行中文分词,作为视频的标题存入视频文本库中;

根据当前链接,视频地址提取模块提取出视频的真实下载地址,再调用视频下载器进行下载;

视频标准化模块将下载下来的视频统一转换成相同格式后存入视频库;

视频特征提取模块会将视频库中的视频进行分析,提取结构特征、关键帧构成结构化信息,并存入视频库;

分类模块先根据视频文本库进行预分类,然后根据视频文本库和视频的结构化信息再进行分类,建立视频数据库并存入分类视频库;

用户通过检索界面提供一幅图像示例进行检索,查询模块将与检索条件匹配的视频返回给用户;

视频下载器的视频资源切分的方法使用二分法通过对视频资源中不同分片资源的IP地址、归属地的确认来下载视频,具体为:

步骤b1,确定要下载的视频的播放时间,获取起始点a和结束点b的IP地址和归属地,如果起始点a和结束点b的IP地址和归属地相同,则确认视频[a,b]的IP地址、归属地,并进入步骤b4;如果起始点a和结束点b的IP地址和归属地不相同,则进入步骤b2;

步骤b2,获取视频片段的中间点x的IP地址和归属地,如果步骤b2被执行10次,则进入步骤b4;

步骤b3,如果中间点x和起始点a的IP地址和归属地相同,则确认视频片段[a,x]段的IP地址、归属地,并将[x,b]构成新的视频片段[a,b]并进入步骤b2;

如果中间点x和结束点b的IP地址和归属地相同,则确认视频片段[x,b]段的IP地址、归属地,并将[a,x]构成新的视频片段[a,b]并进入步骤b2;

如果中间点x与起始点a和结束点b的IP地址和归属地均不相同,则将[a,x]构成新的视频片段[a,b]并进入步骤b2,然后将[x,b]构成新的视频片段[a,b]并进入步骤b2;

步骤b4,记录步骤b2-b3确定各个视频片段在原始视频中分段位置以及相应的IP地址和归属地,并判断各个视频片段的运营商,分块下载视频,从而优化下载速度;

分类模块的聚类分析方法对视频库中的关键帧进行数据挖掘,对关键帧进行自动聚类,采用视频语义信息和关键帧的视觉特征相结合的方式,具体为:

步骤c1,根据视频文本进行预分类,将文本信息相似的视频归为一类,确保视频的主要内容是属于一类的;

步骤c2,在预分类的基础上,在每一个大类中再根据视频库的关键帧的颜色特征进行聚类,将具有相似颜色特征的关键帧聚合为一个小类;

步骤c3,将聚类分析后的视频以及相应文本信息存储构成分类视频库,从而为检索提供便利的数据分类体系;

检索过程具体如下:

步骤d1,用户提供一幅图像,检索模块提取该图像的特征,然后在分类视频库中进行匹配;

步骤d2,计算出待检索图像的特征向量与关键帧特征库中各个类的聚类中心向量的距离,找出距离最近的三个类;

步骤d3,再分别计算三类中的每个图像帧的特征向量与待检索图像的特征向量的距离;

步骤d4,找出距离最近的20幅图像帧;

步骤d5,统计这20幅图像帧关联最多的前5个视频,并返回总共15个结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网山东省电力公司淄博供电公司,未经国网山东省电力公司淄博供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710572720.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top