[发明专利]一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法有效
申请号: | 201810926656.4 | 申请日: | 2018-08-15 |
公开(公告)号: | CN109086437B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 冯永;张逸扬;尚家兴;强保华;邱媛媛 | 申请(专利权)人: | 重庆大学;桂林电子科技大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/51;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 重庆市前沿专利事务所(普通合伙) 50211 | 代理人: | 郭云 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 faster rcnn wasserstein 编码器 图像 检索 方法 | ||
1.一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,包括以下步骤:
S1:搭建深度学习框架,部署Faster-RCNN模型;
S2:对Faster-RCNN模型进行训练,微调网络权重;
S3:提取图像的全局特征,构建图像的全局特征图库;
S4:构建Wasserstein自编码器,并对Wasserstein自编码器进行训练;
S5:采用Wasserstein自编码器对全局特征图进行降维,计算全局特征之间欧几里得距离得出第一相似度,并进行第一次排序,完成图像的粗粒度检索;
S6:提取图像中候选区域的特征作为局部特征,构建图像的局部特征图库;
S7:采用Wasserstein自编码器对局部特征图进行降维,计算图像局部特征之间的第二相似度并进行第二次排序,完成图像的细粒度检索。
2.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S1中,搭建Caffe深度学习框架。
3.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S1中,采用VGG网络结构作为所述Faster-RCNN模型中的特征提取模型。
4.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S2中,采用Oxford5k数据集中的训练集对所述Faster-RCNN模型进行训练。
5.如权利要求1或4所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S2中,采用以下方法对所述Faster-RCNN模型进行训练:
从Oxford5k数据集的11个类别中分别选取5张图像从而得到55张图像,将此55张图像进行水平翻转并保留原始图像,进而得到110张图像,将此110张图像作为训练集;
将Faster-RCNN模型的输出类别调整为12,其中包含11类物体和1类背景;
设置迭代次数为5000,训练方式为端到端训练。
6.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S3中,选择卷积层Conv5_3中的全局特征图,用于构建全局特征图库。
7.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S4中,Wasserstein自编码器包括1层卷积层、3层全连接层和1层反卷积层。
8.如权利要求1所述的融合Faster-RCNN和Wasserstein自编码器的图像检索方法,其特征在于,所述S4中,采用以下方法对Wasserstein自编码器进行训练:
设定Wasserstein自编码器的卷积层卷积核大小为5×5,步长为2;
输入第一特征图,卷积第一特征图可得第二特征图;
将第二特征图重塑到第一全连接层,得到第一特征向量;
第一特征向量映射到第二全连接层,降维输出第二特征向量;
第二特征向量映射到第三全连接层,得到第三特征向量;
对第三特征向量进行重塑,得到第三特征图;
设定Wasserstein自编码器的反卷积层卷积核大小为5×5,步长为2,反卷积第三特征图可得第四特征图;
计算第一特征图和第四特征图的Wasserstein距离作为损失值,多次迭代训练直至收敛,完成Wasserstein自编码器参数的优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学;桂林电子科技大学,未经重庆大学;桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810926656.4/1.html,转载请声明来源钻瓜专利网。
- 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法
- 一种基于Wasserstein GAN的光伏阵列故障诊断方法
- 基于Wasserstein距离的卷积神经网络对抗迁移学习方法及其应用
- 一种基于深度学习和Wasserstein距离度量的指静脉识别方法
- 一种基于Wasserstein距离的深度对抗迁移网络的故障诊断方法
- 一种基于Sliced-Wasserstein距离的深度自编码进行图像降维并嵌入聚类的方法
- 基于信号分布Wasserstein距离度量的Wi-Fi室内定位方法
- 一种采用Wasserstein距离的差分隐私贪心分组方法
- 基于Wasserstein生成对抗网络模型的高能图像合成方法、装置
- 一种基于Wasserstein距离的物体包络体多视图重建与优化方法