[发明专利]一种面向图像检索的分布一致性保持度量学习方法有效
申请号: | 201911089272.2 | 申请日: | 2019-11-08 |
公开(公告)号: | CN110866134B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 赵宏伟;范丽丽;赵浩宇;刘萍萍;李蛟;张媛;袁琳;胡黄水 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/535 | 分类号: | G06F16/535;G06F16/58;G06N3/04;G06N3/08;G06F16/55 |
代理公司: | 哈尔滨龙科专利代理有限公司 23206 | 代理人: | 李长春 |
地址: | 130012 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 图像 检索 分布 一致性 保持 度量 学习方法 | ||
本发明公开了一种面向图像检索的分布一致性保持度量学习方法,所述方法通过一种新颖的样本挖掘和类内难样本挖掘方法,选择有代表性的样本,在提高收敛速度的同时获取更丰富的信息;类内容易样本和难样本的比例为选取的难样本赋予动态权重,以学习类内数据结构特征,对于负样本,根据其周围样本的分布情况设置不同的权重进行学习以保持其相似结构的一致性,从而更准确地提取图像特征。本发明充分考虑了正样本和负样本的分布情况对实验的影响,可以根据模型的训练效果对正样本和负样本的数量及选择进行调整。
技术领域
本发明涉及一种图像检索方法,具体涉及一种面向图像检索的分布一致性保持度量学习方法。
背景技术
近年来,互联网上视觉数据呈现出爆炸式的增长,越来越多的研究工作围绕图像搜索或图像检索技术而展开。早期的搜索技术仅采用文本信息,忽视了视觉内容作为排序的线索,导致搜索文本和视觉内容不一致。基于内容的图像检索(CBIR)技术充分利用视觉内容识别相关图像,在近几年来获得了广泛关注。
从众多图像中检测稳健且有辨别力的特征是图像检索的一个重大挑战。传统方法依赖于手工制作的特征,其中包括光谱(颜色)、纹理和形状特征等全局特征,以及像词袋(BoW)、本地聚合描述符(VLAD)矢量和Fisher矢量(FV)等聚合特征,这种设计耗时并且需要大量的专业知识。
深度学习的发展推动了CBIR的发展,从手工描述符演变到从卷积神经网络(CNNS)中提取学习的卷积描述符。深度卷积神经网络特征是高度抽象的并且具有高级语义信息。此外,深度特征从数据中自动学习,是数据驱动的,在设计特征方面不需要人为的努力,这使得深度学习技术在大规模图像检索中极具价值。深度度量学习(DML)是一种结合深度学习和度量学习的技术,其中度量学习的目的是学习嵌入空间,即鼓励相似样本的嵌入向量更接近,而不相似的样本彼此推开。深度度量学习利用深度卷积神经网络的鉴别能力将图像嵌入到度量空间中,其中可以使用欧几里得距离等简单的度量直接计算测量图像之间的语义相似度。深度度量学习被应用到很多自然图像领域,包括人脸识别、视觉追踪、自然图像检索。
在DML框架中,损失函数起着至关重要的作用,之前的研究中已经提出了大量的损失函数。对比损失捕获成对样本之间的关系,即相似性或相异性,使正对的距离最小化,同时大于边界的负对的距离最大化。基于三重损失也有很广泛的研究,三元组由查询图片、正样本和负样本组成。三重损失的目的是学习一个距离度量使得查询图片相比于负样本更接近正样本。通常来说,由于考虑了正负对之间的关系,三重损失优于对比损失。受此启发,最近很多研究都考虑了多个样本之间更丰富的结构化信息,并且在很多应用(如检索和聚类)上取得了很好的性能。
然而,目前最先进的DML方法仍然有一定的局限性。在之前的一些损失函数中,考虑了对多个样本的结构化信息进行合并,有的方法将和查询图片相同类别的所有除查询图片外的样本都用作正样本,将和查询图片不同类别的样本都当作负样本。通过这种方法可以利用所有非平凡样本构建一个信息量更大的结构用于学习更多的有区别的嵌入向量,虽然这样得到的信息量很大很丰富,但存在很多的冗余信息,对计算量、计算成本和存储成本都带来了很大的麻烦。同时,在之前的结构性损失中没有考虑到类内的样本分布,所有的损失都希望可以尽可能靠近同一类中的样本。因此,这些算法都试图将同一类的样本压缩到特征空间中的一个点上,并且可能很容易丢失它们的一些相似性结构和有用的样本信息。
发明内容
本发明的目的是提供一种面向图像检索的分布一致性保持度量学习方法,通过一种新颖的样本挖掘和类内难样本挖掘方法,选择有代表性的样本,在提高收敛速度的同时获取更丰富的信息;类内容易样本和难样本的比例为选取的难样本赋予动态权重,以学习类内数据结构特征,对于负样本,根据其周围样本的分布情况设置不同的权重进行学习以保持其相似结构的一致性,从而更准确地提取图像特征。
本发明的目的是通过以下技术方案实现的:
一种面向图像检索的分布一致性保持度量学习方法,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911089272.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多方数据服务授权平台
- 下一篇:一种换流阀冷却系统的测试装置以及测试方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序