[发明专利]一种基于点对相似度的深度非松弛哈希图像检索方法有效
申请号: | 201910057434.8 | 申请日: | 2019-01-19 |
公开(公告)号: | CN109783682B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 汪海龙;禹晶;肖创柏;郭乐宁 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/51;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明公开了一种基于点对相似度的深度非松弛哈希图像检索方法,将图像的数据集以5:1的比例划分为训练样本集D |
||
搜索关键词: | 一种 基于 相似 深度 松弛 希图 检索 方法 | ||
【主权项】:
1.一种基于点对相似度的深度非松弛哈希图像检索方法,其特征在于:该方法试图解决哈希学习模型中使用符号函数导致对模型准确率影响的问题,将符号函数
移至卷积神经网络模型之外,取而代之,在模型中使用
范数和软阈值函数;基于哈希学习图像检索的模型原理与流程如下:给定n幅图像的样本数据
每幅输入图像为
其中,
表示实数空间,n为图像的数量,d为图像的尺寸;输出数据为B∈{‑1,1}l×n,B的第i列bi∈{‑1,1}l表示第i个样本xi所对应的长度为l的二值哈希码,也即,哈希学习方法旨在从训练数据中自动学习一个哈希函数H(·),一幅图像通过哈希函数表示为:bi=H(xi)=[h1(xi),…,hl(xi)];对于线性哈希编码函数,每一个哈希函数Hi(·)将单幅图像投影为一个哈希位,l个哈希函数组成一个函数簇将单幅图像投影成一个l位的二值哈希码bi,bi保持了原始空间的中xi的语义信息;用哈希码之间的内积表示哈希码之间的相似度,对于任意两个长度相等的哈希码bi和bj,将这两个哈希码的相似度
用它们的内积定义为:
内积越大,相似度越大,使用sigmoid函数对相似度
进行非线性阈值化,将其范围规范化到区间(0,1),得:
基于哈希码相似度的度量,利用交叉熵损失函数保持点对之间的相似度,图像点对的哈希码与相似度之间的似然p(sij|B)定义为:
式中,sij表示样本对之间的相似度,当样本i和样本j属于同一类别时,sij=1,否则,sij=0;B表示样本数据对应的哈希码;由似然函数表明,当哈希码bi与bj越相似,即
越大,对应的似然函数p(sij|B)就越大;当哈希码bi与bj越不相似,对应的似然函数p(sij|B)就越小;对p(sij|B)的似然取负对数得到交叉熵损失函数,表示为:
在卷积神经网络的输出端使用一种软阈值函数
阈值化网络输出得到准哈希码,并使用
范数
约束输出端的准哈希码,使得准哈希码的各个哈希位的绝对值逼近1;本方法采用的目标函数的最优化问题为:
式中,s表示图像的相似度矩阵,w表示全连接层的神经元参数,υ表示全连接层的偏移量,θ表示卷积层的神经元参数的集合,φ(·)表示图像的特征表示,n表示样本数,目标函数的第一项用于保持相似点对之间的语义相似性,第二项为准哈希码的正则项,用于约束准哈希码,使其各个位的值非线性地逼近‑1或1;n表示样本数,sij∈{0,1}表示样本i和样本j是否相似,λ表示正则项系数,soft表示软阈值函数,η表示软阈值函数的控制参数,bi表示前向网络输出的准哈希码,
表示两个哈希码之间的相似度;在网络模型输出端使用soft(x),输出结果bi将迅速逼近‑1和1这两个值,使得
范数正则项损失减小,同时加快网络收敛的速度;网络经过训练后,在网络模型外部使用符号函数将准哈希码量化为二值哈希码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910057434.8/,转载请声明来源钻瓜专利网。