[发明专利]基于深度特征的视频检索方法、系统、计算机设备及存储介质在审
申请号: | 202010115194.5 | 申请日: | 2020-02-25 |
公开(公告)号: | CN111339369A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 曾凡智;程勇;周燕;陈嘉文 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/75;G06F16/71;G06F16/738;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李君 |
地址: | 528200 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 特征 视频 检索 方法 系统 计算机 设备 存储 介质 | ||
本发明公开了一种基于深度特征的视频检索方法、系统、计算机设备及存储介质,所述方法包括:构建卷积神经网络,所述卷积神经网络为DenseNet模型;获取多个视频;利用DenseNet模型,提取每个视频中视频帧的深度特征向量;针对每个视频,根据视频帧的深度特征向量,提取关键帧,输出关键帧集合;将每个视频与每个视频的关键帧集合建立索引关系,存入视频特征数据库;根据用户提供的图像或短视频,对视频特征数据库中的视频进行检索,输出视频检索结果。本发明实现了高准确率和高召回率的视频检索功能。
技术领域
本发明涉及一种基于深度特征的视频检索方法、系统、计算机设备及存储介质,属于视频检索领域。
背景技术
目前,相对成熟且广泛运用于市场的是一类基于文本标注的视频检索方法。该方法需要人工提前对视频库中的视频进行归纳和注释,视频检索的结果完全依赖于用户的文字表述和人工事先标注的信息。然而,随着视频数量逐渐增大,内容更加多元化,传统的基于人工文本标注的视频检索方法渐渐不能满足人们对更高水准视频检索的需求。而基于内容的视频检索系统中大多采用颜色、纹理、形状、SIFT等特征,这些特征易受到视频模糊、噪声、光照变化等影响。
近年来,深度学习在视频、图像处理领域取得了优异成绩,深度特征描述子具有强大的图像特征描述能力,该方法的检索结果能够满足人们对更高水准视频检索的需求,在安防监控、远程在线教育、影视版权保护、网络短视频审查等领域都拥有广阔的应用前景。
发明内容
有鉴于此,本发明提供了一种基于深度特征的视频检索方法、系统、计算机设备及存储介质,其实现了高准确率和高召回率的视频检索功能。
本发明的第一个目的在于提供一种基于深度特征的视频检索方法。
本发明的第二个目的在于提供一种基于深度特征的视频检索系统。
本发明的第三个目的在于提供一种计算机设备。
本发明的第四个目的在于提供一种存储介质。
本发明的第一个目的可以通过采取如下技术方案达到:
一种基于深度特征的视频检索方法,所述方法包括:
构建卷积神经网络;其中,所述卷积神经网络为DenseNet模型;
获取多个视频;
利用DenseNet模型,提取每个视频中视频帧的深度特征向量;
针对每个视频,根据视频帧的深度特征向量,提取关键帧,输出关键帧集合;
将每个视频与每个视频的关键帧集合建立索引关系,存入视频特征数据库;
根据用户提供的图像或短视频,对视频特征数据库中的视频进行检索,输出视频检索结果。
进一步的,所述DenseNet模型采用DenseNet-201模型;
所述DenseNet-201模型包括依次连接的卷积层、池化层、第一稠密块、第一过渡层、第二稠密块、第二过渡层、第三稠密块、第三过渡层、第四稠密块和分类层。
进一步的,所述根据视频帧的深度特征向量,提取关键帧,输出关键帧集合,具体包括:
将第1帧设为参考帧,并作为关键帧,加入关键帧集合;
根据视频帧的深度特征向量,将当前帧与参考帧进行余弦夹角相似度计算;
若余弦夹角相似度小于阈值,则将当前帧与关键帧集合进行比较,若没有重复,则将当前帧作为关键帧,加入关键帧集合,并将当前帧更新为参考帧;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010115194.5/2.html,转载请声明来源钻瓜专利网。