[发明专利]一种基于场景词典树的图搜视频方法,装置及计算机可读存储介质有效
申请号: | 201910648005.8 | 申请日: | 2019-07-18 |
公开(公告)号: | CN110427517B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 赵国强;朱利霞;王治国;王瑢 | 申请(专利权)人: | 华戎信息产业有限公司 |
主分类号: | G06F16/71 | 分类号: | G06F16/71;G06F16/783;G06V20/40;G06V10/762;G06V10/77 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250101 山东省济南市高新区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 场景 词典 视频 方法 装置 计算机 可读 存储 介质 | ||
1.一种基于场景词典树的图搜视频方法,其特征在于,建立视频场景特征库方法包括:
步骤一,对镜头图像进行分割;
将相邻两帧之间的各个像素的灰度、亮度等分为N个等级,再针对每个等级统计像素数值做成直方图比较,给出两个图像的直方图,直方图计算公式如下:
其中,N为图像帧像素的总数;hm(i)-hn(i)表示的是两帧在i的这个像素值的直方图的距离;设定阈值u,当距离D大于阈值u时,检测到镜头转变;
步骤二,提取镜头全局特征;
步骤三,提取镜头图像中的关键帧;
(1)计算所有帧在预设位置上像素的平均值;
(2)将镜头中该点位置的像素值最接近平均值的帧作为关键帧;
步骤四,提取关键帧的关键帧特征;
采用传统特征SIFT进行关键帧的特征提取;
步骤五,对全局特征进行聚类处理;
利用K-Means,根据提取的镜头全局变量FV对镜头进行聚类,得到以场景为单位的视频信息;
步骤六,配置局部特征压缩编码,得到场景特征库;
利用BoF算法对场景中的所有关键帧的特征进行压缩编码;具体步骤如下:
(1)关键帧图像局部特征SIFT,得到特征集合U;
(2)对特征集合U进行分层聚类得到一个具有h层,每层最多有k个聚类中心的词典树;
(3)计算关键帧的词典向量;基于图像特征提取阶段提取到的图像特征和构建的视觉词典树,计算每张图像的每个图像特征距离词典树节点的距离,将每个图像特征归入距离最近的词典树节点中,然后统计每个节点中包含此张图像的特征个数,得到所述图像在词典树各个节点出现的频率向量Fj;图像特征的词典向量公式为:
dj=WT·Fj (5)
其中WT=log(N/NT),N表示图像库的图像总数,NT表示对于节点T中的特征涵盖的图像数量;
将关键帧根据场景来进行索引存储,得到场景特征库。
2.根据权利要求1所述的基于场景词典树的图搜视频方法,其特征在于,图搜视频方法包括:将待查询图像生成查询图像特征向量;与场景进行相似度比较;将相似度比较结果进行相似度排序。
3.根据权利要求2所述的基于场景词典树的图搜视频方法,其特征在于,步骤将待查询图像生成查询图像特征向量还包括:对待查询图像提取SIFT特征,使用第一阶段词典树,生成查询图像词典向量;步骤与场景进行相似度比较还包括:对某个场景中所有的关键帧词典向量,利用欧式距离计算距离,进行累加,计算公式如下:
其中sim(qi,scenej)表示查询图像qi与第j个场景scenej的相似度,表示查询图像的词典向量,表示场景j的第l个关键帧的词典向量,p表示词典向量的维数;
对公式(6)进行归一化处理,得到最后的计算相似度的公式,如下:
得到查询图像与视频场景的相似度;步骤将相似度比较结果进行相似度排序还包括:根据相似度,对场景进行排序,将前n个场景视频作为查询结果进行保存。
4.一种基于场景词典树的图搜视频方法的装置,其特征在于,包括:存储器,用于存储计算机程序及基于场景词典树的图搜视频方法;处理器,用于执行所述计算机程序及基于场景词典树的图搜视频方法,以实现如权利要求1至3任意一项所述基于场景词典树的图搜视频方法的步骤。
5.一种具有基于场景词典树的图搜视频方法的计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1至3任意一项所述基于场景词典树的图搜视频方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华戎信息产业有限公司,未经华戎信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910648005.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:采用聚类分析的乐曲分类方法
- 下一篇:一种短视频音乐推荐方法