[发明专利]应用于图像检索的半监督哈希学习方法及装置有效
申请号: | 201910022866.5 | 申请日: | 2019-01-10 |
公开(公告)号: | CN109766463B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 张世枫;李建民;张钹 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用于 图像 检索 监督 学习方法 装置 | ||
本公开涉及半监督哈希学习方法及装置,所述方法包括:将样本数据输入教师函数进行处理,得到教师函数输出哈希码,将样本数据输入学生函数进行处理,得到学生函数输出哈希码;根据样本数据、教师函数输出哈希码和学生函数输出哈希码确定学生函数的损失;向学生函数反向传播损失的梯度,以调整学生函数的参数,完成学生函数的一次训练;根据调整后的学生函数的参数和待调整的所述教师函数的参数,确定调整后的教师函数的参数,完成教师函数的一次训练。本公开实施例可以使用少数有标注样本数据和大量无标注样本数据进行训练。教师函数和学生函数进行联合训练得到的教师函数和学生函数可以用于高效、准确地得到数据的哈希码,以用于更加高效的检索。
技术领域
本公开涉及神经网络技术领域,尤其涉及一种半监督哈希学习方法及装置。
背景技术
伴随着人工智能和信息检索技术的发展,图像等复杂数据的检索需求越来越多。以图像检索为例,给定一张图像,我们希望找到像素或语义级别相似的图片。由于图像结构复杂且维度高,图像检索的效率及准确率成为大规模图像数据的难点。
深度哈希学习方法是传统的大规模复杂数据(如图像等)检索的解决方法。哈希学习可以学习特定的哈希函数,将高维复杂数据映射到短的二值哈希码,使得相似的数据(如图像像素相似或者语义相似)的哈希码的汉明距离较小。伴随深度学习技术的发展,可以利用深度神经网络提取复杂数据的向量特征。深度哈希学习可以将深度神经网络作为待学习的哈希函数,进行哈希学习的同时学习深度神经网络,并且用深度神经网络提取复杂数据的哈希码。哈希码存储了数据的语义信息,同时也可以用于大规模复杂数据检索。
现有深度哈希学习的基础在于大量有标注的数据,即每个数据有一个类别标签。但在实际应用中,数据规模巨大(如图片达到上亿级别),人工标注这些数据用于训练需要耗费大量人力财力,几乎不可能;其次,数据标注可能是数据对之间的关系,如社交网络的好友关系,图像文字描述定义的关系等,导致直接标注数据类别并不可取。以上问题,均导致深度哈希学习的效果不理想。
发明内容
有鉴于此,本公开提出了一种半监督哈希学习方法,所述方法包括:
将样本数据输入教师函数进行处理,得到教师函数输出哈希码,将所述样本数据输入学生函数进行处理,得到学生函数输出哈希码;
根据所述样本数据、所述教师函数输出哈希码和所述学生函数输出哈希码确定所述学生函数的损失;
向所述学生函数反向传播所述损失的梯度,以调整所述学生函数的参数,完成所述学生函数的一次训练;
根据调整后的所述学生函数的参数和待调整的所述教师函数的参数,确定调整后的所述教师函数的参数,完成所述教师函数的一次训练。
在一种可能的实现方式中,所述根据所述样本数据、所述教师函数输出哈希码和所述学生函数输出哈希码确定所述学生函数的损失,包括:
根据所述样本数据、所述教师函数输出哈希码和所述学生函数输出哈希码,确定二元相似度损失、一致汉明距离损失和量化错误损失;
根据所述二元相似度损失、所述一致汉明距离损失和所述量化错误损失确定所述学生函数的损失。
在一种可能的实现方式中,所述样本数据包括第一样本数据和第二样本数据,所述根据所述样本数据、所述教师函数输出哈希码和所述学生函数输出哈希码,确定二元相似度损失、一致汉明距离损失和量化错误损失,包括:
根据所述第一样本数据和所述第二样本数据的相似度、所述教师函数输出哈希码和所述学生函数输出哈希码,利用二元相似度损失函数确定所述二元相似度损失。
在一种可能的实现方式中,所述样本数据包括第一样本数据和第二样本数据,所述将样本数据输入教师函数进行处理,得到教师函数输出哈希码,将所述样本数据输入学生函数进行处理,得到学生函数输出哈希码,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910022866.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序