[发明专利]基于策略梯度的大规模图像检索方法及装置有效
申请号: | 201811004958.2 | 申请日: | 2018-08-30 |
公开(公告)号: | CN109189973B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 鲁继文;周杰;袁鑫;任亮亮 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 策略 梯度 大规模 图像 检索 方法 装置 | ||
本发明公开了一种基于策略梯度的大规模图像检索方法及装置,其中,方法包括:接收输入图像;将输入图像送入新的深度哈希网络中,其中,新的深度哈希网络包括卷积神经网络与带有非线性激活函数的全连接的策略层,且使用卷积神经网络学习得到图像的深度表达,并通过带有非线性激活函数的全连接的策略层将每个特征表达转化成一个K维度的向量,每一个维度代表着进行二值操作的概率;通过端到端训练新的深度哈希网络,以最大化相似度保持所得到的奖励的期望。该方法通过采用策略梯度的方法得到一个最优化的深度哈希框架,从而提高大规模图像数据库上的检索精度。
技术领域
本发明涉及计算机图像处理技术领域,特别涉及一种基于策略梯度的大规模图像检索方法及装置。
背景技术
随着信息技术的迅速发展,各行各业积累的数据都呈现出爆炸式增长趋势,已经进入大数据时代。大数据在很多领域都具有广阔的应用前景,已经成为国家重要的战略资源,对大数据的存储、管理和分析也已经成为学术界和工业界高度关注的热点。收集、存储、传输、处理大数据的目的是为了利用大数据,而要有效地利用大数据,机器学习技术必不可少。图像的检索问题的传统方法直接从海量图像的高维向量空间抽取特征,在速度和存储开销等方面都不能取得令人满意的效果。在实际的场景中无法应用,哈希学习进入机器学习领域以后,成为了该领域的一大研究热点。在大规模图像检索的应用场景下,哈希学习通过将数据表示成二进制码的形式,加速检索过程节约内外存开销,取得了优于传统方法的效果。人们广泛关注哈希学习方法,因此产生了该领域的一个热点问题。
大部分现有的基于学习的哈希方法使用浅层结构将数据样本进行编码,即通过学习一个单一的投影矩阵将相似的样本映射到学习的汉明空间中相近的位置。大部分这种类型的方法不能解决数据的非线性问题,限制了图像检索中的性能提高。最近,基于深度学习的哈希方法被提出来学习具有强大判别能力的图像表达以及非线性的哈希映射,在多个图像检索数据集上取得了非常好的性能。
然而,不可微的离散优化中的二值约束是一个具有挑战性问题。该问题使得深度哈希不能被以一种真正端到端的方式去学习。通过连续性放松,不可微的优化问题可以被转化为可以使用标准梯度下降方法进行解决的连续优化问题。虽然很多方法被提出来控制量化误差,但是他们依然不能在一个优化过程中精准地得到二值哈希码,进而可能导致学习到次优的哈希二值码。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种基于策略梯度的大规模图像检索方法,该方法可以得到最有效的梯度和最优的哈希二值码,提高大规模图像数据库上的检索精度。
本发明的另一个目的在于提出一种基于策略梯度的大规模图像检索装置。
为达到上述目的,本发明一方面实施例提出了一种基于策略梯度的大规模图像检索方法,包括以下步骤:接收输入图像;将所述输入图像送入新的深度哈希网络中,其中,所述新的深度哈希网络包括卷积神经网络与带有非线性激活函数的全连接的策略层,且使用所述卷积神经网络学习得到图像的深度表达,并通过所述带有非线性激活函数的全连接的策略层将每个特征表达转化成一个K维度的向量,每一个维度代表着进行二值操作的概率;通过端到端训练所述新的深度哈希网络,以最大化相似度保持所得到的奖励的期望。
本发明实施例的基于策略梯度的大规模图像检索方法,通过采用策略梯度的方法得到一个最优化的深度哈希框架,将哈希网络的不可微分的部分重新形式化为采用随机策略进行采样,以使得传统框架中的放松部分被除去,直接生成二值码并且最大化对于相似度保持的奖励的期望,以克服使得离散优化的不可微分的问题,从而得到最有效的梯度和最优的哈希二值码,提高大规模图像数据库上的检索精度。
另外,根据本发明上述实施例的基于策略梯度的大规模图像检索方法还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述带有非线性激活函数的全连接的策略层输出的概率分布被形式化的表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811004958.2/2.html,转载请声明来源钻瓜专利网。