[发明专利]基于监督转移的零样本哈希图片检索方法在审
申请号: | 201710253104.7 | 申请日: | 2017-04-18 |
公开(公告)号: | CN107346327A | 公开(公告)日: | 2017-11-14 |
发明(设计)人: | 杨阳;罗雅丹;陈纬伦;沈复民;邵杰;申恒涛 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 电子科技大学专利中心51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 转移 样本 希图 检索 方法 | ||
技术领域
本发明属于图像哈希领域,具体涉及一种精确地将图片哈希的方法,尤其是在对于某类图片无训练样本的情况下,仍能够将该类图片进行合理编码的方法。
背景技术
随着越来越多的多媒体数据的产生,哈希成为了应对大规模检索的一种强大的工具,其可以极大程度的缩短在几十亿数据中查找所花费的时间。由于计算机极为擅长异或运算,使用哈希码进行检索可以应对大数据时代所带来的查找需求。
数据库哈希是一个极为重要的工作,对于众多的领域都有着极为重要的意义。因此,哈希在过去的很长一段时间得到了重要的关注,提出了很多重要的算法。如数据无关哈希类的Local Sensitive Hashing(LSH),数据相关哈希类的Iterative Quantization(ITQ),Isotropic Hashing以及监督哈希类的Supervised Hashing with Kernels(KSH),Supervised Discrete Hashing(SDH)。尤其是监督哈希类,通过挖掘语义标签,深入的探索了数据库中各个样本之间的内在关系,极大程度地提高了哈希的精确度。
然而,在大数据时代,随着越来越多的多媒体数据的生成,要求对于每一个类别都拥有训练数据是不现实的。而传统的哈希方法更多是针对静态数据库,面对指数增加的数据库能力有限。因此传统的监督哈希方法不适用于膨胀的数据库。零样本学习(Zeroshot Learning)是一种有效解决样本缺乏的方法。通过学习如何从未观察到的样本特征空间映射到语义空间,从而避免对未观测到的样本重新建模。然而,传统的零样本学习常常有很多限制,如:认为的属性标注歧义、不能应对数据集转移。因此,最近几年,随着自然语言处理领域的发展,零样本学习被给予了新的解决方案。如,通过挖掘巨大的语料库如Wikipedia,监督标签可以被映射为标签向量,而这种标签向量通常被赋予了高于传统标签的语义,从而引导模型对未观察到的空间进行建模。著名的方法包括Socher用标签向量进行监督,引导对于未观测到的数据进行分类,具体见文献“R.Socher,M.Ganjoo,C.D.Manning,and A.Ng.Zero-shotlearning through cross-modal transfer.In NIPS,2013.”。Frome在文献“A.Frome,G.S.Corrado,J.Shlens,S.Bengio,J.Dean,T.Mikolov,et al.Devise:A deep visual-semantic embeddingmodel.In NIPS,2013.”中也采用了相似的策略,但是使用了不同的语言模型并扩展到了更多的类别。
传统的监督哈希的训练模式是,针对某一个特定类别,采用1/0的标签进行监督,引导训练。这样的1/0标签相互之间的相关性为0,也即对于监督的标签来说,类与类之间的差别是固定的。这样做会导致类别之间的关联性得不到体现,从而使得训练出来的哈希模型只能对处于训练集中的类别进行有效的编码,而对于一个从未见过的类别无法可靠地编码,也即无法可靠地对于未见过的类别进行检索。
发明内容
为了克服现有的监督哈希算法对于训练数据的苛刻要求,对于没有训练数据的类哈希能力较弱的缺点,本发明提出了一种新的监督哈希算法,即零样本哈希(Zeroshot Hashing)。本发明对训练样本没有严格要求,应用范围广,特别是在大型数据库里,当类别较多且无法对每一个类别找出训练样本时,本发明可以极大程度地提高对于该类别的图片检索准确率。
本发明利用现有自然语言处理(Natural Language Processing)模型对已有训练数据的标签进行建模,形成一个标签空间。通过新的标签空间潜在的保存标签之间的关系(即各标签在标签空间的空间位置距离关系),训练从图片特征空间到标签空间的映射。在此基础上,将此映射关系反映在哈希码上。
首先将图片表示为图片原始特征,即图片特征空间,再将图片表征成为了机器学习算法可以处理的向量(标签向量),即将图片原始标签通过现有的自然语言处理模型(基于大型语料库训练得到)表征为标签空间(也称语料空间),在标签空间中,语义相近的词汇会有更小的空间位置距离,而语义相去的标签的空间位置距离则会较远。对图片原始特征、标签向量进行哈希函数的学习,从而既可以极大程度的保留已知类别的哈希码学习能力,同时又可以通过自然语言处理后所形成的标签空间的内在关系(空间位置距离关系),隐式地传递未知类别的监督信息,从而对未知类别的数据进行很好的哈希。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710253104.7/2.html,转载请声明来源钻瓜专利网。