[发明专利]基于微视频特征数据库的微视频检索方法及装置有效
申请号: | 201410416334.7 | 申请日: | 2014-08-20 |
公开(公告)号: | CN104156464B | 公开(公告)日: | 2018-04-27 |
发明(设计)人: | 陈芋文;张矩;钟坤华;刘磊锋 | 申请(专利权)人: | 中国科学院重庆绿色智能技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/66 |
代理公司: | 上海光华专利事务所(普通合伙)31219 | 代理人: | 敖欢 |
地址: | 400714 *** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视频 特征 数据库 检索 方法 装置 | ||
技术领域
本发明涉及一种信息检索领域,主要是指数据库服务器的建立及数据库中的信息读取和排序,特别是涉及一种视频图像的检索方法及装置。
背景技术
随着移动通信技术以及终端硬件水平的不断提升,移动互联网得到快速发展,互联网刮起一阵改革的春风。在移动互联网和智能手机逐渐普及的背景下,微视频再度进入人们的视线,市场上开始出现各种相关产品,创业者和投资人们也渐渐将目光投向了这个领域。智能设备计算能力的提高已经使得在手机端拍摄、编辑和创造视频变成现实,微博和脸谱等社交产品也培养和激发了人们分享和交流的需求,因而产生了大量长度在30秒内的UGC(User Generated Content,也即是用户生成内容)微视频,面对这些海量的而且包含大量非结构化微视频数据进行快速检索成为迫切的需求。
近年来,在视频特征提取和检索方面研究者们提出了很多有意义的方法。虽然,这些研究方法在特征提取和检索中有一定的效果,但其计算过程一般较复杂,且特征提取需人工干涉,较复杂的特征提取方法也带来了检索的困难。另外,现有的视频特征提取和检索方法也未针对微视频的特有的特点进行特征提取及检索。
综上所述,如何进行更快速有效的微视频检索,已经成为基于内容信息检索研究领域中需要解决的重要课题之一。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于微视频特征数据库的微视频检索方法及装置,用于解决现有技术中无法针对微视频进行快速有效的检索的问题。
为实现上述目的及其他相关目的,本发明提供以下技术方案:
一种微视频特征数据库的建立方法,包括提取微视频中的图像帧,并将所述图像帧与所述微视频相关联;归一化所述图像帧以得到归一化的图像数据;令所述图像数据作为输入进行自编码网络预训练,以得到所述自编码网络中每层网络的权值参数和偏置参数并予以展开连接成一个完成的自编码网络;采用BP神经网络对所述完成的自编码网络进行微调,将微调后的所述完成的自编码网络的中间层的输出数据转换成二进制码并予以存储。
优选地,在上述微视频特征数据库的建立方法中,所述图像帧包括以一预设间隔频率提取所述微视频一帧的多个图像集合,且所述多个图像集合与所述微视频以多对一的映射方式相关联。优选地,在上述微视频特征数据库的建立方法中,归一化所述图像帧的方法包括:令所述图像帧进行图片平滑处理,得到去噪图像;计算所述去噪图像的平均值;计算所述去噪图像的标准方差;令所述去噪图像减去所述去噪图像的所述平均值并再除以所述去噪图像的标准方差,得到归一化的图像数据。
优选地,在上述微视频特征数据库的建立方法中,令所述图像数据进行自编码网络预训练的方法为:令自编码网络第一层的输入为3027个可视节点单元,并令隐藏层为8192个隐藏节点单元;令所有剩余的连接于所述自编码网络各层的受限玻尔兹曼机的隐藏层隐藏节点单元为N个,并令可见层可视节点单元为2N个;初始化每一层的所述受限玻尔兹曼机权重为一随机实数,偏置为零;令所述图像数据在各层所述受限玻尔兹曼机中进行学习,且每层玻尔兹曼机的学习效率为0.001。
优选地,在上述微视频特征数据库的建立方法中,令BP神经网络对所述完成的自编码网络进行微调的方法为:利用前向计算网络对所述完成的自编码网络进行前馈,以得到所述完成的自编码网络的中间层输出的数据;并利用反馈修正网络对所述中间层输出的数据进行反馈,以修正所述中间层输出的数据;将进行前馈和反馈后的所述完成的自编码网的中间层输出的数据转换为二进制码;并将所述二进制码予以存储。
另外,本发明还提供了一种基于微视频特征数据库的微视频快速检索方法,所述检索方法包括:提取待检微视频的视频帧,并归一化所述视频帧以得到归一化的图像数据;令所述图像数据作为输入以进行所述自编码网络的深度学习,以提取出所述视频帧的二进制码;令所述视频帧的二进制码与微视频特征数据库中的二进制码进行汉明距离计算,并根据计算后的距离值对所述微视频特征数据库中的视频进行由小到大的排序并予以输出。
另外,本发明还提供了一种微视频快速检索装置,包括:视频帧提取模块,用于提取待检微视频的视频帧,并将所述视频帧与所述待检微视频相关联;视频帧预处理模块,用于归一化所述视频帧以得到归一化的图像数据;特征提取模块,用于令所述图像数据作为输入以进行自编码网络的深度学习,以提取出所述视频帧的二进制码;检索模块,用于计算所述视频帧的二进制码与微视频特征数据库中的二进制码的汉明距离,并根据计算后的距离值对所述微视频特征数据库中的视频进行由小到大的排序并予以输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院重庆绿色智能技术研究院,未经中国科学院重庆绿色智能技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410416334.7/2.html,转载请声明来源钻瓜专利网。