[发明专利]基于深度哈希网络和子块重排序的大规模图像子块检索方法有效
申请号: | 201910112021.5 | 申请日: | 2019-02-13 |
公开(公告)号: | CN109871461B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 许勇;刘冠廷 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 网络 子块重 排序 大规模 图像 检索 方法 | ||
1.一种基于深度哈希网络和子块重排序的大规模图像子块检索方法,其特征在于,所述的大规模图像子块检索方法包括下述步骤:
S1、数据准备,准备已通过大规模图像数据库预训练的深度网络权重和待训练的纹理图片库;
S2、训练样本挑选,通过预处理、正负样本构建和困难样本挖掘,选出具有代表性的训练样本;
S3、通过搭建网络结构和构造损失函数训练基于图像外观相似性的深度哈希网络,保存训练完成的网络参数;
S4、图像子块重排序,以深度哈希网络作为哈希码提取器,将图片中的所有子块排成队列,其中相似子块聚集在一起;过程如下:
S41、随机定位一个图像子块,在只有H×H个子块的邻域中进行暴力的最近邻查找,每个子块仅仅访问一次,其中,H取值为4或5;
S42、当该邻域中的子块都被访问过,此时队列的最后一个子块在全图范围中查找最近邻子块;
S43、定位到新的子块,并以其为中心划分新的H×H个子块的邻域;
S44、重复步骤S41-S43,直至访问完所有子块,按照访问顺序,所有子块将排成一维队列,此时每个子块的前后多个子块都是自己的相似子块;
S5、通过连续敏感哈希,对两张图片进行子块之间的快速映射,并将子块队列链接进来,实现快速定位。
2.根据权利要求1所述的基于深度哈希网络和子块重排序的大规模图像子块检索方法,其特征在于,所述的步骤S1、数据准备的过程如下:
S11、下载通过大规模图像库ImageNet预训练过的AlexNet网络权重;
S12、选择能够表达图像外观的纹理图片库UIUC_texture。
3.根据权利要求1所述的基于深度哈希网络和子块重排序的大规模图像子块检索方法,其特征在于,所述的步骤S2、训练样本挑选的过程如下:
S21、预处理,将每张图片下采样到256*256的大小,并进行随机裁剪和正则化处理;
S22、正样本构建,从同一标签下随机挑选两张图片,组成图片对,作为正样本;
S23、负样本构建,随机从两个不同标签下各自选取一张图片组成图片对,作为负样本;
S24、通过K-Means聚类,在容易混淆的类别之间构建更多负样本,作为挖掘出的困难样本。
4.根据权利要求1所述的基于深度哈希网络和子块重排序的大规模图像子块检索方法,其特征在于,所述的步骤S3中搭建网络结构的过程如下:
S31、输入图像X;
S32、将图像X输入卷积层conv1,卷积核大小为11,步长为4,进行局部响应归一化,再通过非线性激活和池化层,得到特征图X1;
S33、将特征图X1输入卷积层conv2,卷积核大小为5,步长为1,进行局部响应归一化,再通过非线性激活和池化层,得到特征图X2;
S34、将特征图X2输入卷积层conv3,卷积核大小为3,步长为1,通过激活层得到特征图X3;
S35、将特征图X3输入卷积层conv4,卷积核大小为3,步长为1,通过激活层得到特征图X4;
S36、将特征图X4输入卷积层conv5,卷积核大小为3,步长为1,通过激活层和池化层得到特征图X5;
S37、将特征图X5输入2层长度为4096的全连接层,得到全连接特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910112021.5/1.html,转载请声明来源钻瓜专利网。