[发明专利]一种单模态图像哈希检索方法在审
申请号: | 202010577850.3 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111737507A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 凌泽乐;高岩;高明;金长新 | 申请(专利权)人: | 浪潮集团有限公司 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06F16/583;G06K9/62;G06N3/04 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 郗艳荣 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 单模 图像 检索 方法 | ||
本发明特别涉及一种单模态图像哈希检索方法。该单模态图像哈希检索方法,包括图像预处理,图像特征提取,输出注意力图像和生成哈希检索模型四部分。该单模态图像哈希检索方法,通过attention机制提取图片模态中的语义信息,提高了哈希检索模型生成哈希函数的质量,同时通过使用多级语义监督方式,增强了拥有多个标签数据间检索的精度,使得最为匹配的项位于最终检索结果的前面,从而极大的提高了检索效率。
技术领域
本发明涉及图像检索技术领域,特别涉及一种单模态图像哈希检索方法。
背景技术
随着科技进步,互联网技术飞速发展,技术更新日新月异,图像视频数据出现大爆炸式的增长。常规的图像检索技术包括基于文本的图像检索技术(Text-based ImageRetrieval,简称TBIR)和基于内容的图像检索(Content-based Image Retrieval,简称CBIR) 技术两种检索方式。其中,基于文本的图像检索技术是利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等;基于内容的图像检索技术是对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术。目前,基于内容的图像检索技术成为主流的图像检索方法。
图像哈希检索技术旨在将已有数据集合进行搜索,找出符合要求的图像数据。由于哈希码具有存储数据小,检索速度快的优点,所以哈希检索被广泛应用在检索任务中。现有的图像哈希检索技术可以分为深度模型检索技术和非深度模型检索技术两类。传统做法一般是采用深度网络,提取图像特征,并根据提取到的特征使用全连接网络在交叉熵损失将样本转化成哈希码保存在数据库中。
由于在现实环境中,一个图像中包含非常多丰富信息,往往存在多个类被信息,对于传统的针对一个类信息往往精确度不够,图像中的背景中的冗余信息和值得重点关注区域的信息在哈希学习过程中居于同样的地位。而现有的大多哈希检索模型旺旺只关注图像中值得重点关注区域的信息,不能充分利用全部图像信息。
基于上述问题,本发明提出了一种单模态图像哈希检索方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的单模态图像哈希检索方法。
本发明是通过如下技术方案实现的:
一种单模态图像哈希检索方法,其特征在于:包括图像预处理,图像特征提取,输出注意力图像和生成哈希检索模型四部分;
首先通过定义多级语义相似关系矩阵来保持多标签数据中丰富的语义信息,同时采用Attention机制自发寻找图像中的重点关注区域,通过学习生成与图像表示大小相同的掩码,从而提取图片模态中的语义信息,辅助哈希检索模型得到更高质量的哈希函数。
本发明单模态图像哈希检索方法,具体实施步骤如下:
第一步,获取训练集原始图片,将图像分别对应不同残差网络进行输入;
第二步,将训练样本输入哈希检索模型,通过最小化损失函数优化哈希检索模型参数;
第三步,固定模型,将所有样本通过哈希检索模型得到对应的哈希码,存入输入库以备使用;
第四步,使用哈希检索模型进行检索任务时,只需要将图片任意模态样本输入模型生成该模态对应哈希码,然后在另一模态的哈希码数据库中寻找海明距离最近的N个(按需求自定义)哈希码,返回与之对应的样本即可。
所述第二步中,采用迭代优化的方法优化模型参数,即固定一个参数,优化另外的参数。
所述第二步中,优化哈希检索模型,包括以下步骤:
(1)生成具有多级语义的相似性矩阵S;
(2)提取图片模态的特征,得到图像模态特征Pi,并对图像进行分类任务,输出注意力图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮集团有限公司,未经浪潮集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010577850.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据修改方法及系统
- 下一篇:一种基于区块链的自助打印方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序