[发明专利]一种基于节点表征的无监督深度哈希模型训练方法及图像检索方法在审
申请号: | 202011100159.2 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112199533A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 汪洋涛;刘渝;李春花;牛中盈;王冲;周可 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/532 | 分类号: | G06F16/532;G06F16/583 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 宋业斌 |
地址: | 430074 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 节点 表征 监督 深度 模型 训练 方法 图像 检索 | ||
本发明公开了一种基于节点表征的无监督深度哈希模型训练及图像检索方法,该方法可以将图像与图像之间的相似关系融入到潜在的图像表征中去,进而通过无监督的方式生成图像的语义哈希码,得到一个无监督的图像检索模型。该方法将每一张图像视为一个节点,利用图像初始化特征之间的Cosine距离度量图像的相似性,并设计了一种基于图卷积网络的自编码器,根据图像之间的相似性以无监督的方式生成每张图像的节点表征信息,然后利用这些表征信息在一个轻量级的网络上指导哈希函数的学习,生成图像的语义哈希码,提升了无监督哈希图像检索的性能。本发明有效地学习了图像之间的相似性,其图像检索性能优于目前的无监督哈希方法。
技术领域
本发明属于图像检索领域,更具体地,涉及一种基于节点表征的无监督深度哈希模型训练方法及图像检索方法。
背景技术
哈希码具有轻量级存储、高效异或运算的优点,这使得图像哈希成为图像检索领域中重要的技术手段。
基于图像哈希的图像检索方法包括有监督的哈希检索方法、以及无监督的哈希检索方法两种,其中有监督的哈希方法在哈希函数的学习过程中,加入了图像的标签信息,如图像的类别标签,能够更好地维护数据之间的语义相似性,从而生成高质量的哈希码。无监督的哈希方法不需要数据的标签信息,直接通过挖掘数据内在的联系,保持数据原有的几何结构相似性来训练哈希函数。
尽管有监督的哈希检索方法取得了不错的检索效果,但在实际场景中,其无法实现对标签图像的检索,因此无监督的哈希检索方法更为常见。然而,无监督的哈希检索方法并没有充分学习图像之间的相似性,从而限制了哈希码的质量,并进而导致图像检索效果不佳。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于节点表征的无监督深度哈希模型训练方法及图像检索方法,其目的在于,解决现有无监督的哈希检索方法由于没有充分学习图像之间的相似性,从而限制了哈希码的质量,并进而导致图像检索效果不佳的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于节点表征的无监督深度哈希模型的训练方法,该无监督深度哈希模型包括顺次连接的ResNet-101网络、基于GCN的自编码器AE、以及ResNet-18网络,所述训练方法包括以下步骤:
(1)获取N张图像所构成的训练集,将该训练集输入ResNet-101网络中,以从该网络的池化层提取每张图像的特征向量,所有图像的特征向量构成向量集合FV:
FV={v1,v2,…,vN},
其中N为正整数,vq表示向量集合FV中的第q个特征向量,且有q∈[1,N];
(2)从步骤(1)得到的向量集合FV中选择M个图像的特征向量构成M个节点,根据这M个节点构建一个图结构G=(X,E),其中X表示这M个节点构成的集合且有X=[x1,x2,…,xM],表示M个节点中的任意两个节点xi和xj连接成的边,其中i和j均为正整数,且有i和j均∈[1,M];
(3)从步骤(2)构建得到的图结构G中获取M个节点的关系矩阵A,利用获取的关系矩阵A和M个节点对基于GCN的AE进行迭代训练,直到该AE收敛为止,并获得此时每一个节点xk∈X的g维表征信息g(xk),其中k∈[1,M],g∈{16,32,48,64,96,128};
(4)使用步骤(3)得到的节点xk∈X的g维表征信息g(xk)作为标签信息对ResNet-18网络进行迭代训练,直到该ResNet-18网络收敛为止,并获得此时节点xk对应的g维语义哈希码bk。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011100159.2/2.html,转载请声明来源钻瓜专利网。