[发明专利]一种基于深度学习的视频检索方法有效
申请号: | 201810268186.7 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108228915B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 丁泉龙;廖奕铖;韦岗;李杰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的视频检索方法,主要包含以下部分:利用卷积神经网络做视频预处理;用长短记忆网络对预处理后的视频提取特征向量;最后通过一个相似度学习算法,学习得到距离计算方法,依据该方法进行相似度计算并排序,得出视频检索结果;本发明通过卷积神经网络做场景分割和关键帧选择,提取表征视频的高级语义,从而获取恰当数量的关键帧序列,能够有效避免镜头分割的误检和漏检。本发明通过长短记忆网络有效提取视频的时序特征,从而获得更准确的检索结果。通过相似度学习和基于文本的匹配方法,能够提升相似度度量方法的匹配精确度。通过上述方法,本发明能够实现对大规模视频的精准检索。 | ||
搜索关键词: | 一种 基于 深度 学习 视频 检索 方法 | ||
【主权项】:
1.一种基于深度学习的视频检索方法,其特征在于包括以下步骤:步骤1)利用训练数据,对视频预处理网络进行训练;步骤2)利用所述步骤1)得到的视频预处理网络,分割待检索视频,形成镜头单元并提取镜头的关键帧序列;步骤3)根据所述步骤2)得到的镜头关键帧序列的长短,分为长镜头和短镜头两类;判断是否通过长短记忆网络LSTM,若为短镜头,跳转到所述步骤5);步骤4)利用训练完成的长短记忆网络提取关键帧序列的特征向量,生成特征向量文本;步骤5)利用训练完成的相似度学习算法,获得特征向量的相似距离计算公式K(xi,xj),其中xi和xj是待匹配的特征向量对;步骤6)依据步骤5)得到的相似度计算方法,计算待检索样本与数据库视频的相似度,得到检索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810268186.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种信息推送系统
- 下一篇:数据的查询方法及装置