[发明专利]一种图像检索模型、训练方法在审
申请号: | 202110365966.5 | 申请日: | 2021-04-06 |
公开(公告)号: | CN113326864A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 王建;张智超;宋巍;黄冬梅;赵丹枫;郑小罗 | 申请(专利权)人: | 上海海洋大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 孟旭彤 |
地址: | 201306 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 检索 模型 训练 方法 | ||
一种图像检索模型训练方法,该模型的损失函数其中,m是全部样本的数量;P为正样本对集合;Pi为第i个样本作查询样本时,正样本对的集合;N为负样本对集合;Ni为第i个样本作查询样本时,负样本对的集合;n为选择的负样本对数量;δ为负样本对相似度从高到底排序的顺序(1‑n);r为阈值参数,代表对负样本对优化的权重;λ、d为阈值参数,共同表示将正负样本拉开的距离;S表示相似度;Sik表示第i个样本和第k的样本的相似度;α、β为阈值参数,分别代表对正样本对损失的权重和对负样本对损失的权重。
技术领域
本发明属于人工智能技术领域,特别涉及一种图像检索模型、训练方法。
背景技术
对于图像检索识别领域,设计一个有效的相似性度量是提高视觉分析系统性能的关键。现有文献中提出了大量的损失函数,如对比度损失[1]、三重线损失[2]、四线损失[3]、提升结构损失[4]、N对损失[5]、基于距离加权余量的损失[6]、三重线中心损耗[7]、二项式偏离损耗[8]、直方图损失[9]、角度损失[10]、多重相似性损失[11],对于这种基于对的损耗,将样本分为正对和负对,它们都从样本中提取信息,以缩短正对之间的距离,从而将负样本推开。
对比损失:基于成对数据,对比损失旨在最小化正对之间的距离,同时惩罚负对之间的距离小于预定义的裕度m。对比损失只挖掘距离小于m的负对,并为所有选择的对分配相等的权重。
三重态损耗:基于三重态数据,设计了三重态损耗,使三重态中正对的距离比负对的距离小一个裕度m。具体地说,三元组损失挖掘出合适的样本,形成信息丰富的三元组,并为所有选择的对分配相等的权重。
N对损耗:三重态损耗同时拉一个正样本,同时推一个负样本。为了通过与更多的负类和样本的相互作用来提高三重态的损失,设计了N对损失来从N-1类的N-1个负样本(每个类一个负样本)中识别出一个正样本。具体地说,N对损失挖掘信息样本时,每类随机抽取一个正对,形成N对,然后利用N对之间的多类关系进行挖掘。然后它为三重态中的正负对分配相等的权重。
提升结构损失:不再只使用每一类的一个负样本,而是将所有的负样本纳入训练小批量中。对于每一个正样本对,提升结构化损失的目标是拉得尽可能近,并将对应的所有负样本推远到一个裕度m。给定一个查询样本,提升结构化损失打算在小批量中从所有对应的负样本中识别出一个正样本,以充分探索结构关系。具体来说,提升结构损耗利用所有的负样本,挖掘信息样本,使铰链函数返回非零值。然后对于正对,提升结构损失分配权重,而为每个负对分配不同的权重。
多重相似性损失:在提升结构损失的基础上,通过更广义的加权策略,设计多相似度损失,充分利用正负对。首先,通过预先设定的阈值,采用三元组准则挖掘信息对:对距离大于最小负对最小距离的正对进行采样,对距离小于正对最大距离加阈值的负对进行采样。具体地说,多相似性损失通过对正、负对的三元组准则挖掘信息对,然后分别为正对和负对分配不同的权重。
本文涉及的参考文献包括:
[1]R.Hadsell,S.Chopra,and Y.LeCun,“Dimensionality Reduction byLearning an Invariant Mapping,”in 2006IEEE Computer Society Conference onComputer Vision and Pattern Recognition-Volume 2(CVPR’06),New York,NY,USA,2006, vol.2,pp.1735–1742,doi:10.1109/CVPR.2006.100.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海洋大学,未经上海海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110365966.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序