[发明专利]一种基于目标检测的无监督深度哈希方法有效
申请号: | 201910449029.0 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110196918B | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 毛先领;涂荣成;黄河燕;程序;邹佳 | 申请(专利权)人: | 北京理工大学;中电科大数据研究院有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 唐华 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 目标 检测 监督 深度 方法 | ||
1.一种基于目标检测的无监督深度哈希方法,其特征在于:利用目标检测获得图片中存在的物体标签,并将这些标签作为图片的伪标签,基于伪标签训练设计好的端到端深度哈希模型,得到每张图片在汉明空间中的哈希码表示;再通过对应哈希码在图片检索任务中的平均准确率均值来评价深度哈希模型的好坏;其中,平均准确率均值,即Mean AveragePrecision,简称MAP;
基于目标检测的无监督深度哈希方法依托的无监督深度哈希模型包括目标检测算法单元以及哈希网络单元;
其中,哈希网络单元包括顺序连接的五个卷积层和三个全连接层;
其中,五个卷积层和三个全连接层中的前两个全连接层的激活函数均为ReLU,最后一个全连接层的激活函数为双曲正切函数tanh;
目标检测算法单元与哈希网络单元相连;
目标检测算法单元用于挖掘图片中的隐语义标签;哈希网络单元用于生成图片的哈希码;
所述基于目标检测的无监督深度哈希方法,包括如下步骤:
步骤1:选取一个目标检测方法,将该方法在大规模的图片数据集上按照选取的目标检测方法的训练步骤进行训练,输出训练好的目标检测单元;
步骤2:选取公共图片数据集中百分之八十的图片作为图片数据集P,剩下的百分之二十作为测试集T;
其中,图片数据集P中包含n张图片,测试集T中包含r张图片;
P中的第k张图片表示为Pk∈P;k的取值范围为1到n;
T中的第k张图片表示为Tk∈T;k的取值范围为1到r;
步骤3:将图片数据集P中的图片输入到预训练好的目标检测单元中检测标签;若一张图片能被检测出标签,则将检测出的标签作为该图片伪标签;若检测不出标签则舍去该图片,将所有被检测出标签的图片构成新的图片数据集P′;
其中,预训练好的目标检测单元即步骤1输出的训练好的目标检测单元;
其中,图片数据集P′中包含m张图片,m表示被检测出标签的图片总数,且m小于等于n;
P′中的第j张图片表示为Pj′∈P′;j的取值范围为1到m;
步骤4:根据图片数据集P′中图片的伪标签构造图片数据集P′中的图片对相似性矩阵S;
其中,图片对相似性矩阵S中的第i行第j列表示为sij,S中的元素sij取值范围为[0,1],且sij越接近1表示图片Pi′和图片Pj′越相似,反之sij越接近0表示图片Pi′和图片Pj′越不相似;
步骤5:初始化无监督深度哈希模型中哈希网络单元参数;
其中,哈希网络单元参数,记为θ,包括哈希网络单元中所有网络层的权重参数和偏置参数;
步骤6:设置收敛判断值flag的判断初始值;
其中,判断初始值的取值范围为3到10;
步骤7:选取mini-batch大小为B并对每个mini-batch集合进行训练;
其中,mini-batch集合是指将图片数据集P′随机分成份,每一份有B张图片,每一份就是一个mini-batch,简记为MB;
其中,表示的值向下取整;
步骤7,包括如下子步骤:
对图片数据集P′,按大小为B划分个mini-batch集合,对每一个MB做如下训练:
步骤7.1:将MBi输入哈希网络单元,获得输出ui;
其中,MBi代表MB中的第i张图片;ui表示MBi经过哈希网络单元处理后的输出;
步骤7.2:对输出ui进行量化,得到bi,按照损失函数公式(2)计算损失:
其中,θ表示哈希网络单元中的所有权重参数及偏置参数;且表示ui和uj的点积,近似为哈希码之间的汉明距离;bi表示量化ui后的哈希码,量化方式为当ui的某一位大于0时,bi的对应位置值为1,反之bi的对应位置值为-1;Iij是一个指示函数,其定义为当sij=0 or 1时,Iij=1,反之Iij=0;tij=2sij-1;α及η表示哈希网络单元的超参数α和超参数η;sigmoid(Θij)的定义如公式(4)所示:
步骤7.3:基于随机梯度下降反向更新哈希网络单元参数θ;
步骤8:当哈希网络单元损失随训练次数epoch下降较为缓慢时,降低学习率到原来的十分之一;
其中,较为缓慢指当前训练时刻与前一时刻损失差值的绝对值小于阈值1;
步骤9:判断当前步骤7.2所计算的损失和上一个训练时刻步骤7.2所计算的损失的差值的绝对值是否小于阈值2,若是则将收敛判断值flag减1,否则令收敛判断值flag的值为判断初始值;
步骤10:判断当前损失是否收敛,即判断收敛判断值flag的值是否等于0,若等于0,即收敛,则获得训练好的哈希网络单元,并跳至步骤11,若不等于0,即不收敛,则跳至步骤7;
至此,步骤1到步骤10使用图片数据集P完成了对哈希网络单元的训练;
步骤11:将图片数据集P中的所有图片依次输入哈希网络单元,并获得所有图片量化后对应的哈希码;
其中,数据集P中的第i张图片,记为Pi,其量化后的哈希码,记为bi;
步骤12:将测试集T中的图片输入上述训练好的哈希网络单元,得到其对应的哈希码;
步骤13:计算“测试集T中图片的哈希码”与“图片数据集P中图片的哈希码”的汉明距离,并按汉明距离从小到大排序,返回检索图片;
其中,返回的检索图片是经汉明距离从小到大排序的前Y张图片;
步骤14:依据步骤13返回的检索图片计算MAP、WMAP、NDCG、ACG值,即为评判无监督深度哈希模型优劣的评价指标;
至此,步骤9到步骤12使用测试集T完成了对哈希网络单元的测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学;中电科大数据研究院有限公司,未经北京理工大学;中电科大数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910449029.0/1.html,转载请声明来源钻瓜专利网。