[发明专利]一种快速优化深度哈希图像编码方法及目标图像检索方法有效
申请号: | 201910701690.6 | 申请日: | 2019-07-31 |
公开(公告)号: | CN110457503B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 张超;苏树鹏;韩凯;田永鸿 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06N3/04;G06N3/08;G06T9/00 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种快速优化深度哈希图像编码方法及目标图像检索方法,基于贪心策略,针对大型图像数据集,建立哈希图像编码模型,通过优化后得到的深度哈希编码网络生成所有图像的二值编码。在进行目标图像检索时,可通过计算查询图像编码和数据库图像编码之间的汉明距离,迅速得到查询图像的同类相似图像。本发明方法结合神经网络更好地解决了梯度消失和量化误差问题,编码性能更优;用更少的迭代次数完成深度网络的训练过程,训练速度更快;能应用于各种带离散约束的问题,应用范围更广;进一步提高深度神经网络的优化速度和所生成图像编码的检索性能,有效提高了大型图像数据库的检索精度。 | ||
搜索关键词: | 一种 快速 优化 深度 希图 编码 方法 目标 图像 检索 | ||
【主权项】:
1.一种快速优化深度哈希图像编码方法,针对大型图像数据集,基于贪心策略建立哈希图像编码模型,通过优化后得到的深度哈希编码网络生成所有图像的二值编码;包括如下步骤:/n1)哈希图像编码问题建模,得到哈希图像编码模型;/n哈希图像编码模型表示为式(1):/n
/ns.t.B∈{-1,+1}K 式(1)/n其中,B表示利用深度网络对输入图像进行前向传播而生成的二值编码;其中约束条件约束了该编码B的每一位只能从{-1,+1}中选择,一共有K位,即每幅图像都编码为K位二值码;L(B)表示对B计算的损失函数;/n2)使用贪心策略求解哈希图像编码模型,得到最优的二值编码B;包括如下操作:/n21)求解过程中,在不考虑离散约束B∈{-1,+1}K的情况下,先计算出L关于B的梯度
然后使用下式的梯度下降法进行迭代更新,表示为式(2):/n
/n其中,t表示训练过程中的第t轮更新,lr表示算法提前设定好的学习率;Bt表示第t轮更新后的编码B;Bt+1表示第t+1轮更新后的编码B;L表示模型的损失函数;用梯度更新式(2)求出来的Bt+1是L(B)在不考虑离散约束情况下选出的当前迭代的最优更新方向;/n22)得到离该连续值Bt+1最近的且满足离散取值约束的解,即sgn(Bt+1),sgn()表示逐元素地使用符号函数;/n23)向该解sgn(Bt+1)的方向进行参数更新,即利用式(3)求解式(1):/n
/n3)在深度网络中设计深度哈希图像编码模块,训练哈希图像编码模型,实现式(3)的更新方式;包括如下操作:/n31)使用卷积神经网络将输入图像表示为一串取连续值的图像特征H;/n32)在卷积神经网络的最后一层设计一个全新的深度哈希图像编码模块:/n输入是连续值图像特征H,输出是编码B;/n在深度哈希图像编码模块中实现式(3)的更新方式;模块前向传播中对H逐位的使用符号函数,得到取二值的编码B;/n模块反向传播时将编码B得到的梯度信息直接赋值给H,即令H的梯度信息等于B的梯度信息,使梯度顺利回传到前层网络;/n4)神经网络的训练和收敛完成后,得到训练好的图像深度哈希编码网络;/n5)利用训练好的深度哈希编码网络,对所有数据库图像进行编码,生成数据库图像编码;/n通过上述过程,实现基于贪心策略的快速优化深度哈希图像编码。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910701690.6/,转载请声明来源钻瓜专利网。