[发明专利]一种基于目标检测的无监督深度哈希方法有效

申请号：	201910449029.0	申请日：	2019-05-28
公开（公告）号：	CN110196918B	公开（公告）日：	2021-05-04
发明（设计）人：	毛先领;涂荣成;黄河燕;程序;邹佳	申请（专利权）人：	北京理工大学;中电科大数据研究院有限公司
主分类号：	G06F16/583	分类号：	G06F16/583
代理公司：	北京正阳理工知识产权代理事务所(普通合伙) 11639	代理人：	唐华
地址：	100081 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于目标检测监督深度方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于目标检测的无监督深度哈希方法，其特征在于：利用目标检测获得图片中存在的物体标签，并将这些标签作为图片的伪标签，基于伪标签训练设计好的端到端深度哈希模型，得到每张图片在汉明空间中的哈希码表示；再通过对应哈希码在图片检索任务中的平均准确率均值来评价深度哈希模型的好坏；其中，平均准确率均值，即Mean AveragePrecision，简称MAP；

基于目标检测的无监督深度哈希方法依托的无监督深度哈希模型包括目标检测算法单元以及哈希网络单元；

其中，哈希网络单元包括顺序连接的五个卷积层和三个全连接层；

其中，五个卷积层和三个全连接层中的前两个全连接层的激活函数均为ReLU，最后一个全连接层的激活函数为双曲正切函数tanh；

目标检测算法单元与哈希网络单元相连；

目标检测算法单元用于挖掘图片中的隐语义标签；哈希网络单元用于生成图片的哈希码；

所述基于目标检测的无监督深度哈希方法，包括如下步骤：

步骤1：选取一个目标检测方法，将该方法在大规模的图片数据集上按照选取的目标检测方法的训练步骤进行训练，输出训练好的目标检测单元；

步骤2：选取公共图片数据集中百分之八十的图片作为图片数据集P，剩下的百分之二十作为测试集T；

其中，图片数据集P中包含n张图片，测试集T中包含r张图片；

P中的第k张图片表示为P_k∈P；k的取值范围为1到n；

T中的第k张图片表示为T_k∈T；k的取值范围为1到r；

步骤3：将图片数据集P中的图片输入到预训练好的目标检测单元中检测标签；若一张图片能被检测出标签，则将检测出的标签作为该图片伪标签；若检测不出标签则舍去该图片，将所有被检测出标签的图片构成新的图片数据集P′；

其中，预训练好的目标检测单元即步骤1输出的训练好的目标检测单元；

其中，图片数据集P′中包含m张图片，m表示被检测出标签的图片总数，且m小于等于n；

P′中的第j张图片表示为P_j′∈P′；j的取值范围为1到m；

步骤4：根据图片数据集P′中图片的伪标签构造图片数据集P′中的图片对相似性矩阵S；

其中，图片对相似性矩阵S中的第i行第j列表示为s_ij，S中的元素s_ij取值范围为[0,1]，且s_ij越接近1表示图片P_i′和图片P_j′越相似，反之s_ij越接近0表示图片P_i′和图片P_j′越不相似；

步骤5：初始化无监督深度哈希模型中哈希网络单元参数；

其中，哈希网络单元参数，记为θ，包括哈希网络单元中所有网络层的权重参数和偏置参数；

步骤6：设置收敛判断值flag的判断初始值；

其中，判断初始值的取值范围为3到10；

步骤7：选取mini-batch大小为B并对每个mini-batch集合进行训练；

其中，mini-batch集合是指将图片数据集P′随机分成份，每一份有B张图片，每一份就是一个mini-batch，简记为MB；

其中，表示的值向下取整；

步骤7，包括如下子步骤：

对图片数据集P′，按大小为B划分个mini-batch集合，对每一个MB做如下训练：

步骤7.1：将MB_i输入哈希网络单元，获得输出u_i；

其中，MB_i代表MB中的第i张图片；u_i表示MB_i经过哈希网络单元处理后的输出；

步骤7.2：对输出u_i进行量化，得到b_i，按照损失函数公式(2)计算损失：

其中，θ表示哈希网络单元中的所有权重参数及偏置参数；且表示u_i和u_j的点积，近似为哈希码之间的汉明距离；b_i表示量化u_i后的哈希码，量化方式为当u_i的某一位大于0时，b_i的对应位置值为1，反之b_i的对应位置值为-1；I_ij是一个指示函数，其定义为当s_ij＝0 or 1时，I_ij＝1，反之I_ij＝0；t_ij＝2s_ij-1；α及η表示哈希网络单元的超参数α和超参数η；sigmoid(Θ_ij)的定义如公式(4)所示：