[发明专利]一种基于Spark和深度哈希的视频并行检索方法在审

专利信息
申请号: 202010254440.5 申请日: 2020-04-02
公开(公告)号: CN111444390A 公开(公告)日: 2020-07-24
发明(设计)人: 卑璐璐;赵文婧;厉丹;黄凯 申请(专利权)人: 徐州工程学院
主分类号: G06F16/783 分类号: G06F16/783;G06F16/71;G06K9/00;G06F16/738;G06K9/62
代理公司: 北京淮海知识产权代理事务所(普通合伙) 32205 代理人: 张旭
地址: 221000 江苏省徐州市泉山区南三环*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 spark 深度 视频 并行 检索 方法
【说明书】:

发明公开了一种基于Spark和深度哈希的视频并行检索方法,先对原始视频数据集进行基于CNN的视频关键帧图像深度特征提取,得到视频摘要图像深度特征集;然后对视频摘要图像深度特征集进行基于分布式哈希的视频关键帧图像特征量化,得到图像分布式编码特征集和编码查找本;最后对待检索图像采用基于Spark的视频并行检索,通过基于Spark的分布式计算结合编码查找本,最终返回检索到的最近似图像所在的视频。本发明能在保证视频检索准确性的前提下,有效提高检索的计算效率,进而提高了视频检索的速度。

技术领域

本发明涉及一种视频并行检索方法,具体是一种基于Spark和深度哈希的视频并行检索方法。

背景技术

在大规模视频数据的检索过程中,传统的串行遍历检索模式已经出现瓶颈,也增大了检索系统的负担。分布式平台Hadoop的出现提高了大规模视频检索的速度和效率,但大部分研究主要采用的MapReduce并行模型在磁盘中进行运算,与基于内存的分布式计算引擎Spark模型相比,Spark每个作业中间输出的结果可以存储在内存中,无需读写HDFS(即分布式文件系统)。因此,Spark模型可以更好地适应视频检索过程中的迭代匹配的过程,从而提高检索速度。

在视频图像特征提取方面,基于内容的视频检索最初主要通过对特定场景用主观判断手动提取特征,如:纹理、边缘、形状、颜色特征等单个或多个特征的融合,这种方式很容易导致图像特征提取不完整。卷积神经网络(Convolutional Neural Networks,CNN)的出现提供了一种隐式自动学习的图像特征提取方案;基于CNN的深度特征不仅能够保留更多图像细节信息,在图像特征表示方面也表现出优于传统特征的效果。在近年来基于CNN的视频检索研究中,VGG模型具有较深的网络层数和较好的通用性,但训练的特征数量非常大,且随着网络层数的增多也加入了较多与图像信息无关的噪声特征。因此,需要在深度特征提取环节抑制背景噪声、突出有效判别部分,从而提取更有效的深度特征信息。

为了提高视频检索的准确性,提取的视频关键帧图像特征需要保留更多的图像信息。因此其特征往往包含更高的维度,如基于VGG-16的CNN模型提取的深度特征有4096维,庞大的特征维度也降低了特征存储和检索的效率。为此,采用哈希编码的方式能够对高维特征向量进行编码压缩,从而节省存储空间、提升计算效率。然而,这些研究普遍是在单机的环境下,对于分布式存储的场景仍需要先把所有数据集中在单个节点进行编码模型训练,由此带来了更高的数据计算与存储压力,导致进行大量视频检索时无法保证视频检索的速度。因此,亟需适应视频图像分布式存储环境进行分布式哈希编码模型训练,从而优化哈希模型训练与计算存储的过程,使得在保证视频检索的准确性的前提下,能有效提高视频检索的速度。

发明内容

针对上述现有技术存在的问题,本发明提供一种基于Spark和深度哈希的视频并行检索方法,能在保证视频检索准确性的前提下,有效提高视频检索的速度。

为了实现上述目的,本发明采用的技术方案是:一种基于Spark和深度哈希的视频并行检索方法,具体步骤为:

步骤一、基于CNN的视频关键帧图像深度特征提取:对原始视频数据集进行关键帧提取获得视频摘要数据集;先从视频摘要数据集中划分出训练集,然后基于VGG网络和PWA算法进行加权聚合筛选,筛选过程中利用无监督策略选择部分卷积层滤波器生成概率权值方案,通过聚合对应各语义内容的加权区域表示获取最终的特征表示;筛选出最终特征向量,从而根据最终特征向量构成深度特征提取模型;最后根据深度特征提取模型对视频摘要数据集处理后生成视频摘要图像深度特征集;

步骤二、基于分布式哈希的视频关键帧图像特征量化:根据视频摘要图像深度特征集,先从其中划分出哈希编码模型训练集,并根据哈希编码模型训练集进行哈希乘积量化编码,从而完成分布式哈希编码模型的训练;根据已完成训练的分布式哈希编码模型对视频摘要图像深度特征集处理后生成图像分布式编码特征集;并根据图像分布式编码特征集生成编码查找本;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐州工程学院,未经徐州工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010254440.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top