[发明专利]一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法有效
申请号: | 201810926656.4 | 申请日: | 2018-08-15 |
公开(公告)号: | CN109086437B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 冯永;张逸扬;尚家兴;强保华;邱媛媛 | 申请(专利权)人: | 重庆大学;桂林电子科技大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/51;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 重庆市前沿专利事务所(普通合伙) 50211 | 代理人: | 郭云 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 faster rcnn wasserstein 编码器 图像 检索 方法 | ||
本发明公开一种融合Faster‑RCNN(Faster‑Regions with Convolutional Neural Network,快速区域卷积神经网络)和Wasserstein自编码器的图像检索方法。本发明搭建深度学习框架,采用Faster‑RCNN模型提取图像特征;对Faster‑RCNN模型进行训练,微调网络权重;提取图像的全局特征,构建图像的全局特征图库;构建Wasserstein自编码器,并对Wasserstein自编码器进行训练;采用Wasserstein自编码器对全局特征进行降维,计算欧几里得距离得出第一相似度,并进行第一次排序,完成图像的粗粒度检索;提取图像中候选区域的特征作为局部特征,构建图像的局部特征图库;采用Wasserstein自编码器对局部特征进行降维,计算第二相似度并进行第二次排序,完成图像的细粒度检索。该方法能加快图像的检索速度以及提高图像检索的准确率。
技术领域
本发明涉及图像检索技术领域,特别涉及一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法。
背景技术
随着互联网中图像资源的爆炸式增长,人们对于图像的检索次数已经超过网页文本检索次数,意味着人们进入读图时代。面对海量的图像数据,如何快速、准确地检索出内容相关的图像,成为大数据图像检索亟待解决的关键问题。传统的图像检索方法主要是基于图像内容的检索,即通过对图像的颜色分布、形状轮廓、纹理结构等底层视觉信息进行统计,比较图像之间视觉特征的相似度,从图像数据库中检索出与目标图像匹配相似的图像。由于图像底层视觉信息以及统计方法表征能力的局限性,对于大规模复杂图像检索的结果难以令人满意。
相比于传统的特征统计学习方法,深度学习通过构建多层神经网络模型,使用大规模图像数据训练并拟合网络中成千上万的参数,使得模型具有强大的表征能力,从而提取到图像更具有语义信息的高层特征。
通常,检索系统是根据提取到图像的全局特征,在图像库中匹配并检索相似图像。但是,用户观察图像时,往往只对图像中的部分区域或某个目标物体感兴趣,比如图像中某地标建筑物等;特征图中存在冗余信息,同时,考虑到检索系统的时效性以及减低特征的存储空间,需要对特征图降维处理。传统的主成分分析等降维方法,没有考虑到特征图中特征之间的内在联系,降维处理后存在部分特征丢失,从而影响图像检索的准确性。
中国发明专利申请公布号CN105912611A公开了一种基于CNN的快速图像检索方法,该方法包括一下步骤:1)利用CNN网络对要检索的图像进行特征提取,得到代表图像的矢量特征;利用Google Net网络架构,通过Inception结构实现了在小幅度增加计算量的情况下,让网络走向更深层次;2)在特征数据库中对此矢量特征进行k近邻检索。该发明方法能完成对图像的检索,但当图像中有多个目标时,就不能准确地提取出图像的局部特征,并且检索速度较慢。
发明内容
针对已有图像检索技术方法中图像检索速度慢、检索准确率偏低、特征降维过程中部分特征丢失的问题,本发明提供一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法,提取图像的全局特征和局部特征,并且进行特征降维,计算出图像特征的相似度,根据相似度完成图像的准确检索。
为了实现上述目的,本发明提供以下技术方案:
一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法,包括以下步骤:
S1:搭建深度学习框架,部署Faster-RCNN模型;
S2:对Faster-RCNN模型进行训练,微调网络权重;
S3:提取图像的全局特征,构建图像的全局特征图库;
S4:构建Wasserstein自编码器,并对Wasserstein自编码器进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学;桂林电子科技大学,未经重庆大学;桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810926656.4/2.html,转载请声明来源钻瓜专利网。
- 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法
- 一种基于Wasserstein GAN的光伏阵列故障诊断方法
- 基于Wasserstein距离的卷积神经网络对抗迁移学习方法及其应用
- 一种基于深度学习和Wasserstein距离度量的指静脉识别方法
- 一种基于Wasserstein距离的深度对抗迁移网络的故障诊断方法
- 一种基于Sliced-Wasserstein距离的深度自编码进行图像降维并嵌入聚类的方法
- 基于信号分布Wasserstein距离度量的Wi-Fi室内定位方法
- 一种采用Wasserstein距离的差分隐私贪心分组方法
- 基于Wasserstein生成对抗网络模型的高能图像合成方法、装置
- 一种基于Wasserstein距离的物体包络体多视图重建与优化方法