[发明专利]基于深度学习和哈希编码的视频检索方法有效
申请号: | 201710530458.1 | 申请日: | 2017-06-30 |
公开(公告)号: | CN107229757B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 陈熙霖;乔师师;王瑞平 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/43 | 分类号: | G06F16/43;G06F16/483;G06N3/08 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;李科 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 编码 视频 检索 方法 | ||
1.一种用于对视频数据库进行视频检索的方法,包括:
获得一张静态图像作为待查询图像样本;
利用深度网络将所述待查询图像样本表示为二值哈希编码;
通过将所述待查询图像样本的二值哈希编码与所述视频数据库中的所有视频数据二值哈希编码进行相似度匹配,获得查询结果,其中所述视频数据二值哈希编码是通过下列步骤得到的:
步骤1)、利用深度网络提取视频数据的特征矩阵;
步骤2)、将所述步骤1)获得的视频数据的特征矩阵作为整体进行建模表示,并采用变换前后保距的矩阵对数操作将所获取的建模表示变换至欧氏空间中,以获得所述视频数据的在欧氏空间中的高维实值表示;
步骤3)、通过视频数据学习一组哈希函数,基于所述哈希函数将所述视频数据的高维实值表示利用深度网络进一步表示为二值哈希编码。
2.一种用于对视频数据库进行视频检索的方法,包括:
获得一段动态视频作为待查询视频样本;
将所述待查询视频样本表示为二值哈希编码;
通过将所述待查询视频样本的二值哈希编码与所述视频数据库中的所有视频数据二值哈希编码进行相似度匹配,获得查询结果;
其中所述待查询视频样本和所述视频数据的二值哈希编码是通过下列步骤得到的:
步骤1)、利用深度网络提取视频数据的特征矩阵;
步骤2)、将所述步骤1)获得的视频数据的特征矩阵作为整体进行建模表示,并采用变换前后保距的矩阵对数操作将所获取的建模表示变换至欧氏空间中,以获得所述视频数据的在欧氏空间中的高维实值表示;
步骤3)、通过视频数据学习一组哈希函数,基于所述哈希函数将所述视频数据的高维实值表示利用深度网络进一步表示为二值哈希编码。
3.一种用于深度网络建立的图像数据库进行视频检索的方法,包括:
获得一段动态视频作为待查询视频样本;
将所述待查询视频样本表示为二值哈希编码;
通过将所述待查询视频样本的二值哈希编码与所述图像数据库中的所有图像的二值哈希编码进行相似度匹配,获得查询结果;
其中所述待查询视频样本的二值哈希编码是通过下列步骤得到的:
步骤1)、利用深度网络提取视频数据的特征矩阵;
步骤2)、将所述步骤1)获得的视频数据的特征矩阵作为整体进行建模表示,并采用变换前后保距的矩阵对数操作将所获取的建模表示变换至欧氏空间中,以获得所述视频数据的在欧氏空间中的高维实值表示;
步骤3)、通过视频数据学习一组哈希函数,基于所述哈希函数将所述视频数据的高维实值表示利用深度网络进一步表示为二值哈希编码。
4.根据权利要求1至3任一项中所述的方法,所述相似度匹配通过计算待查询图像/视频样本的二值哈希编码与视频数据库/图像数据库存储的每个视频数据/图像数据的二值哈希编码间的海明距离实现。
5.根据权利要求1至3任一项中所述的方法,所述步骤2)采用协方差统计方法对所述视频样本的特征矩阵进行整体建模表示。
6.一种视频检索系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器运行所述程序时执行如权利要求1至5任一项所述的步骤。
7.一种计算机可读存储介质,包括存储在所述可读存储介质上的计算机程序,其中,所述程序执行如权利要求1至5任一项所述的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710530458.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:功率变换装置及其设置方法
- 下一篇:一种洗衣机减震吊杆组件及洗衣机