[发明专利]一种基于点对相似度的深度非松弛哈希图像检索方法有效

申请号：	201910057434.8	申请日：	2019-01-19
公开（公告）号：	CN109783682B	公开（公告）日：	2021-01-15
发明（设计）人：	汪海龙;禹晶;肖创柏;郭乐宁	申请（专利权）人：	北京工业大学
主分类号：	G06F16/583	分类号：	G06F16/583;G06F16/51;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	沈波
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于相似深度松弛希图检索方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于点对相似度的深度非松弛哈希图像检索方法，其特征在于：该方法试图解决哈希学习模型中使用符号函数导致对模型准确率影响的问题，将符号函数移至卷积神经网络模型之外，取而代之，在模型中使用范数和软阈值函数；

基于哈希学习图像检索的模型原理与流程如下：给定n幅图像的样本数据每幅输入图像为其中，表示实数空间，n为图像的数量，d为图像的尺寸；输出数据为B∈{-1，1}^l×n，B的第i列b_i∈{-1，1}^l表示第i个样本x_i所对应的长度为l的二值哈希码，也即，哈希学习方法旨在从训练数据中自动学习一个哈希函数H(·)，一幅图像通过哈希函数表示为：b_i＝H(x_i)＝[h₁(x_i)，…，h_l(x_i)]；

对于线性哈希编码函数，每一个哈希函数H_i(·)将单幅图像投影为一个哈希位，l个哈希函数组成一个函数簇将单幅图像投影成一个l位的二值哈希码b_i，b_i保持了原始空间的中x_i的语义信息；用哈希码之间的内积表示哈希码之间的相似度，对于任意两个长度相等的哈希码b_i和b_j，将这两个哈希码的相似度用它们的内积定义为：内积越大，相似度越大，使用sigmoid函数对相似度进行非线性阈值化，将其范围规范化到区间(0，1)，得：基于哈希码相似度的度量，利用交叉熵损失函数保持点对之间的相似度，图像点对的哈希码与相似度之间的似然p(s_ij|B)定义为：式中，s_ij表示样本对之间的相似度，当样本i和样本j属于同一类别时，s_ij＝1，否则，s_ij＝0；B表示样本数据对应的哈希码；由似然函数表明，当哈希码b_i与b_j越相似，即越大，对应的似然函数p(s_ij|B)就越大；当哈希码b_i与b_j越不相似，对应的似然函数p(s_ij|B)就越小；对p(s_ij|B)的似然取负对数得到交叉熵损失函数，表示为:

在卷积神经网络的输出端使用一种软阈值函数阈值化网络输出得到准哈希码，并使用范数约束输出端的准哈希码，使得准哈希码的各个哈希位的绝对值逼近1；本方法采用的目标函数的最优化问题为：

式中，s表示图像的相似度矩阵，w表示全连接层的神经元参数，υ表示全连接层的偏移量，θ表示卷积层的神经元参数的集合，φ(·)表示图像的特征表示，n表示样本数，目标函数的第一项用于保持相似点对之间的语义相似性，第二项为准哈希码的正则项，用于约束准哈希码，使其各个位的值非线性地逼近-1或1；n表示样本数，s_ij∈{0，1}表示样本i和样本j是否相似，λ表示正则项系数，soft表示软阈值函数，η表示软阈值函数的控制参数，b_i表示前向网络输出的准哈希码，表示两个哈希码之间的相似度；在网络模型输出端使用soft(x)，输出结果b_i将迅速逼近-1和1这两个值，使得范数正则项损失减小，同时加快网络收敛的速度；网络经过训练后，在网络模型外部使用符号函数将准哈希码量化为二值哈希码。

2.根据权利要求1所述的一种基于点对相似度的深度非松弛哈希图像检索方法，其特征在于：包括以下步骤，

步骤1：将图像的数据集以5:1的比例划分为训练样本集D_train和测试样本集D_test，每个样本集包括一幅图像和其对应的类别标签；

步骤2：构建深度卷积网络架构，使用的网络模型包含：卷积层、全连接层、dropout层、哈希层，卷积层自动提取图像的特征，池化层缩减图像维度，全连接层拟合分类器并量化网络的误差损失，哈希层用于生成图像的哈希码，其中，dropout层用于两个全连接层之间，模型中dropout值设置为0.7，在训练过程中，用于随机去除30％的神经元，防止模型过拟合；

步骤3：利用训练样本集合，将训练数据集图像以及其类别标签作为神经网络的输入训练卷积神经网络，得到并保存深度神经网络的模型；

步骤4：根据步骤3保存的卷积神经网络模型，去除其dropout层，每层的输出乘上相应的dropout比例系数，并在网络的输出端添加符号函数；将训练样本集D_train和D_test输入模型中，得到训练样本集的哈希码B_train和测试样本集的哈希码B_test；

步骤5：从测试样本取测试图像的哈希码，计算该哈希码与训练样本集哈希码之间的汉明距离，得到汉明距离对应的向量；

步骤6：将汉明距离向量的每一位数值以升序排序，取出前若干个，作为检索的结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910057434.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一种农产品价格信息采集及处理装置和方法
下一篇：一种用于实时监控的音频聚类方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于点对相似度的深度非松弛哈希图像检索方法有效

专利文献下载