[发明专利]基于度量学习的深度哈希方法有效

专利信息
申请号: 202010453613.6 申请日: 2020-05-26
公开(公告)号: CN111611413B 公开(公告)日: 2023-04-18
发明(设计)人: 周蓝翔;肖波;王义飞;王浩宇;尹恒 申请(专利权)人: 北京邮电大学
主分类号: G06F16/51 分类号: G06F16/51;G06F16/53;G06N3/0464;G06N3/084;G06N3/08
代理公司: 北京挺立专利事务所(普通合伙) 11265 代理人: 高福勇
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 度量 学习 深度 方法
【说明书】:

基于度量学习的深度哈希方法,涉及计算机视觉和图像处理领域,解决现有深度哈希方法的对比损失函数只能使得相同类别的图像在量化前的特征向量尽可能接近,但并不能鼓励其符号相同;使不同类别图像的量化前的值尽可能远离,但并不能鼓励其符号相反;最终导致量化后的哈希码鉴别力差,造成误判等问题,本发明构建哈希对比损失函数,对于量化前的实数值特征向量进行符号位的约束,使得量化前的实数值特征向量在经过符号函数量化后,得到的代表图像的哈希编码更加的准确,通过fsubgt;sim/subgt;(fsubgt;i/subgt;·fsubgt;j/subgt;)和fsubgt;diff/subgt;(fsubgt;i/subgt;·fsubgt;j/subgt;)两个控制函数,对符号进行约束;表达式中其他部分用于使相同类别图像的特征值接近,不同类别图像特征值远离。本发明方法有效的提高分类的精度,减少了误判率。

技术领域

本发明涉及计算机视觉和图像处理领域,具体涉及一种基于度量学习的深度哈希方法。

背景技术

随着信息时代的到来,信息技术和存储技术得到高速发展,每天都有海量的数据生成,其中图像数据的规模更是爆发性增长,大规模数据如果是用直接的相似性检索势必会导致极大的时间和空间的开销。同时,由于图像的结构比较复杂,特征的维度也较高,在大规模数据集中保证图像检索的检索精度和检索效率是急需攻克的难题。

深度哈希方法的主要流程:首先是基于卷积层、池化层等构建一个卷积神经网络用于对图像的特征提取,常用的特征提取网络(由浅至深)有Alexnet、VGG、ResNet等等。网络的输入是一张图像,经过特征提取网络后获得一组特征图,特征图经过一系列全连接层后训练成代表该图像的特征向量。最后,使用符号函数(sgn(·))将特征向量映射成为±1的哈希值。网络输入中,有的采取单图像的输入,但更多的是采用图像对(image pairwise)的方式输入到网络中。深度哈希方法一部分受限于特征提取网络的深度,这个决定了提取特征的好坏;更重要的是,深度哈希方法的准确度受量化过程(使用符号函数将特征向量映射成为哈希码)的影响较大,很多文章都是在这个地方做优化做改进,目的就是1、让量化前的特征向量和量化后的哈希值尽可能接近,即特征向量尽可能的接近于±1,能避免太多的特征丢失;2、让相同类别的特征向量,能在每一位都能都特别接近;3、让不同类别的特征向量,能在尽可能多的位上的值,都相差很远。

现有用于快速图像检索的深度监督哈希法(Deep supervised hashing for fastimage retrieval,以下简称DSH):DSH发表在CVPR2016上,是深度哈希方法发展过程中极为重要的一个进步。DSH提出了有监督的哈希方法,在输入时利用成对的图像输入网络进行训练,与此同时输入二者的标签关系,同类的两张图像:S=1,不同类别的两张图像:S=0。DSH还设计了一个对比损失函数,使用欧氏距离来计算两张图像的特征向量的距离,对比损失函数的目的是使同类图像特征之间的距离更小,不同类别图像特征之间的距离更大。DSH还设计了一个量化损失函数,使得图像的特征向量更接近于±1(二值化),从而减少图像语义信息的丢失。最后通过符号函数对特征向量进行量化操作,得到哈希码,在之后的图像检索中,均使用哈希码去计算汉明距离来进行最近邻检索。总的来说,DSH的目的就是基于深度卷积神经网络学习到能表达图像特征的、且表达近似离散的特征向量,这样能在量化时保留更多的语义信息,且将同类和不同类别的图像更好的区分开。

现有的对比损失函数只能使得相同类别的图像在量化前的特征向量尽可能接近,但并不能鼓励其符号相同;只能使不同类别图像的量化前的值尽可能远离,但并不能鼓励其符号相反。由于最终进行图像检索时是根据量化后的哈希编码来判别的,对比损失极有可能让同类图像的部分比特位出现在0附近接近的情况,尤其是两个的特征值还是一正一负,分别位于0的两侧,经过符号函数量化后的值一个为+1,一个为-1,最终会造成量化后得到的哈希码的鉴别力下降,造成误判。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010453613.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top