[发明专利]一种基于点对相似度的深度非松弛哈希图像检索方法有效
申请号: | 201910057434.8 | 申请日: | 2019-01-19 |
公开(公告)号: | CN109783682B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 汪海龙;禹晶;肖创柏;郭乐宁 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/51;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 相似 深度 松弛 希图 检索 方法 | ||
1.一种基于点对相似度的深度非松弛哈希图像检索方法,其特征在于:该方法试图解决哈希学习模型中使用符号函数导致对模型准确率影响的问题,将符号函数移至卷积神经网络模型之外,取而代之,在模型中使用范数和软阈值函数;
基于哈希学习图像检索的模型原理与流程如下:给定n幅图像的样本数据每幅输入图像为其中,表示实数空间,n为图像的数量,d为图像的尺寸;输出数据为B∈{-1,1}l×n,B的第i列bi∈{-1,1}l表示第i个样本xi所对应的长度为l的二值哈希码,也即,哈希学习方法旨在从训练数据中自动学习一个哈希函数H(·),一幅图像通过哈希函数表示为:bi=H(xi)=[h1(xi),…,hl(xi)];
对于线性哈希编码函数,每一个哈希函数Hi(·)将单幅图像投影为一个哈希位,l个哈希函数组成一个函数簇将单幅图像投影成一个l位的二值哈希码bi,bi保持了原始空间的中xi的语义信息;用哈希码之间的内积表示哈希码之间的相似度,对于任意两个长度相等的哈希码bi和bj,将这两个哈希码的相似度用它们的内积定义为:内积越大,相似度越大,使用sigmoid函数对相似度进行非线性阈值化,将其范围规范化到区间(0,1),得:基于哈希码相似度的度量,利用交叉熵损失函数保持点对之间的相似度,图像点对的哈希码与相似度之间的似然p(sij|B)定义为:式中,sij表示样本对之间的相似度,当样本i和样本j属于同一类别时,sij=1,否则,sij=0;B表示样本数据对应的哈希码;由似然函数表明,当哈希码bi与bj越相似,即越大,对应的似然函数p(sij|B)就越大;当哈希码bi与bj越不相似,对应的似然函数p(sij|B)就越小;对p(sij|B)的似然取负对数得到交叉熵损失函数,表示为:
在卷积神经网络的输出端使用一种软阈值函数阈值化网络输出得到准哈希码,并使用范数约束输出端的准哈希码,使得准哈希码的各个哈希位的绝对值逼近1;本方法采用的目标函数的最优化问题为:
式中,s表示图像的相似度矩阵,w表示全连接层的神经元参数,υ表示全连接层的偏移量,θ表示卷积层的神经元参数的集合,φ(·)表示图像的特征表示,n表示样本数,目标函数的第一项用于保持相似点对之间的语义相似性,第二项为准哈希码的正则项,用于约束准哈希码,使其各个位的值非线性地逼近-1或1;n表示样本数,sij∈{0,1}表示样本i和样本j是否相似,λ表示正则项系数,soft表示软阈值函数,η表示软阈值函数的控制参数,bi表示前向网络输出的准哈希码,表示两个哈希码之间的相似度;在网络模型输出端使用soft(x),输出结果bi将迅速逼近-1和1这两个值,使得范数正则项损失减小,同时加快网络收敛的速度;网络经过训练后,在网络模型外部使用符号函数将准哈希码量化为二值哈希码。
2.根据权利要求1所述的一种基于点对相似度的深度非松弛哈希图像检索方法,其特征在于:包括以下步骤,
步骤1:将图像的数据集以5:1的比例划分为训练样本集Dtrain和测试样本集Dtest,每个样本集包括一幅图像和其对应的类别标签;
步骤2:构建深度卷积网络架构,使用的网络模型包含:卷积层、全连接层、dropout层、哈希层,卷积层自动提取图像的特征,池化层缩减图像维度,全连接层拟合分类器并量化网络的误差损失,哈希层用于生成图像的哈希码,其中,dropout层用于两个全连接层之间,模型中dropout值设置为0.7,在训练过程中,用于随机去除30%的神经元,防止模型过拟合;
步骤3:利用训练样本集合,将训练数据集图像以及其类别标签作为神经网络的输入训练卷积神经网络,得到并保存深度神经网络的模型;
步骤4:根据步骤3保存的卷积神经网络模型,去除其dropout层,每层的输出乘上相应的dropout比例系数,并在网络的输出端添加符号函数;将训练样本集Dtrain和Dtest输入模型中,得到训练样本集的哈希码Btrain和测试样本集的哈希码Btest;
步骤5:从测试样本取测试图像的哈希码,计算该哈希码与训练样本集哈希码之间的汉明距离,得到汉明距离对应的向量;
步骤6:将汉明距离向量的每一位数值以升序排序,取出前若干个,作为检索的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910057434.8/1.html,转载请声明来源钻瓜专利网。