[发明专利]一种基于Spark和深度哈希的视频并行检索方法在审
申请号: | 202010254440.5 | 申请日: | 2020-04-02 |
公开(公告)号: | CN111444390A | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 卑璐璐;赵文婧;厉丹;黄凯 | 申请(专利权)人: | 徐州工程学院 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/71;G06K9/00;G06F16/738;G06K9/62 |
代理公司: | 北京淮海知识产权代理事务所(普通合伙) 32205 | 代理人: | 张旭 |
地址: | 221000 江苏省徐州市泉山区南三环*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 spark 深度 视频 并行 检索 方法 | ||
1.一种基于Spark和深度哈希的视频并行检索方法,其特征在于,具体步骤为:
步骤一、基于CNN的视频关键帧图像深度特征提取:对原始视频数据集进行关键帧提取获得视频摘要数据集;先从视频摘要数据集中划分出训练集,然后基于VGG网络和PWA算法进行加权聚合筛选,筛选过程中利用无监督策略选择部分卷积层滤波器生成概率权值方案,通过聚合对应各语义内容的加权区域表示获取最终的特征表示;筛选出最终特征向量,从而根据最终特征向量构成深度特征提取模型;最后根据深度特征提取模型对视频摘要数据集处理后生成视频摘要图像深度特征集;
步骤二、基于分布式哈希的视频关键帧图像特征量化:根据视频摘要图像深度特征集,先从其中划分出哈希编码模型训练集,并根据哈希编码模型训练集进行哈希乘积量化编码,从而完成分布式哈希编码模型的训练;根据已完成训练的分布式哈希编码模型对视频摘要图像深度特征集处理后生成图像分布式编码特征集;并根据图像分布式编码特征集生成编码查找本;
步骤三、基于Spark的视频并行检索:首先利用深度特征提取模型对输入待检索的图像进行图像特征向量提取;然后利用分布式编码模型将提取的图像特征向量生成图像哈希编码;通过基于Spark的分布式计算结合编码查找本进行并行检索,获得图像分布式编码特征集中最近的聚类中心,再根据线性重排,最终返回检索到的最近似图像所在的视频。
2.根据权利要求1所述的一种基于Spark和深度哈希的视频并行检索方法,其特征在于,所述步骤一的具体过程为:
(1)对于原始视频数据集,首先传递到预训练的深度网络VGG-16模型提取深度卷积层特征f,所述深度卷积层特征f由C个通道特征图组成,每个特征图高度为H、宽度为W;并通过N个筛选出来的部分判别检测器加权聚合表示,即为N*C维的矢量表示;
(2)选择基于视频摘要数据集训练出部分判别检测器,选择具有更大差异的特征图通道,因此通过计算每个通道特征的方差进行筛选,C维向量gi(i=1,2,...,D)的C通道方差V={v1,v2,...,vc,...,vC}:
(3)对C通道的方差{v1,v2,...,vC}进行排序,选择方差最大的前N个判别式卷积层滤波器作为部分判别检测器;然后,通过无监督策略生成概率权值方案,每个概率权值方案都对应于隐含的固定语义内容,通过选择概率权值方案加权PWA表示,构造具有高度H和宽度W的C×W×H维深度卷积特征f的加权和集:
系数wn是归一化权重,其数值由部分判别检测器生成的所选概率权值方案的位置(x,y)中的激活值vn(x,y)确定:
其中α和β分别是功率归一化和功率缩放的参数;
(4)从加权和池化过程获得N个选择的C维区域表示ψn(I),进而通过连接选定的区域表示得到全局N×C维表示向量ψ(I):
ψ(I)=[ψ1,ψ2,...,ψN]
其中根据特征集中C通道的方差值选择部分判别检测器;
(5)通过后处理对全局表示ψ(I)执行l2-归一化、主成分分析(Principal ComponentAnalysis,PCA)压缩和白化,并获得最终的图像特征M维表示ψPWA(I):
其中V是大小为M×N的PCA矩阵,M是保留维度的数量,σ1,σ2,…,σM是相关的奇异值;最终的图像特征M维表示即为最终的特征向量,根据最终特征向量构成深度特征提取模型;最后根据深度特征提取模型对视频摘要数据集处理后生成视频摘要图像深度特征集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐州工程学院,未经徐州工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010254440.5/1.html,转载请声明来源钻瓜专利网。