[发明专利]基于深度学习和哈希的图像检索方法有效
申请号: | 201510901348.2 | 申请日: | 2015-12-07 |
公开(公告)号: | CN105512289B | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 张晨民;赵慧琴;彭天强 | 申请(专利权)人: | 郑州金惠计算机系统工程有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 陈大通 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 哈希函数 图像检索 量化误差 哈希 卷积神经网络 准确率 图像底层特征 内在关系 深度特征 特征表达 提取图像 图像特征 学习能力 二值化 分类器 哈希码 学习 检索 图像 挖掘 引入 | ||
1.一种基于深度学习和哈希的图像检索方法,具体包含如下步骤:
步骤1.将图像数据集及其对应的类别标签信息分别对应分成两部分,一部分作为训练样本集,另一部分作为测试样本集,其中,训练样本集和测试样本集中每个样本均包括一张图像及对应的类别标签;
步骤2.构建深度卷积神经网络架构,深度卷积神经网络架构包含卷积子网络、哈希层、损失层,卷积子网络用于学习图像特征,哈希层包括全连接层、激活层和阈值化层,用于学习哈希函数的构建并得到输入图像的哈希码,损失层包括Softmax分类器损失模块和量化误差损失模块;输入图像通过卷积子网络得到图像特征x(i),进入哈希层,假设需要生成哈希码的长度为q,全连接层将图像特征x(i)映射为q维向量,即f(x(i))=Wx(i),其中,W表示全连接层的参数矩阵;激活层使用双正切激活函数将q维向量映射为值域在[-1,1]之间的q维向量,即其中,v=f(x(i)),参数β用于控制平滑度;阈值化层将激活层的值进行量化,其中,s=tanh(f(x(i))),阈值化层的输出为二进制哈希码;
步骤3.利用训练样本集,依据深度卷积神经网络架构,得到深度卷积神经网络模型;
步骤4.根据深度卷积神经网络模型,将训练样本集和测试样本集中的每张图像作为输入,得到训练样本集的哈希码Htrain和测试样本集的哈希码Htest;
步骤5.从Htest取一个测试图像的哈希码Ht,计算该哈希码Ht与训练样本集哈希码Htrain之间的汉明距离,得到汉明距离向量;
步骤6.汉明距离向量中的数值按从小到大的顺序进行排序,按顺序输出对应的原始图像,得到图像检索结果。
2.根据权利要求1所述的基于深度学习和哈希的图像检索方法,其特征在于:步骤2中卷积子网络包括多个卷积层,池化层和全连接层。
3.根据权利要求1中所述的基于深度学习和哈希的图像检索方法,其特征在于:步骤2中的量化误差损失模块,用于获得激活层输出的连续值与阈值化层输出的哈希码之间误差损失其中,h=g(tanh(f(x(i))))为阈值化层输出的哈希码,x=tanh(f(x(i)))为激活层输出的连续值。
4.根据权利要求1或3所述的基于深度学习和哈希的图像检索方法,其特征在于:损失层损失函数为Lloss=LsoftmaxLoss+λLq,其中,为Softmax分类器损失模块的误差损失,Lq为量化误差损失模块的误差损失,λ为权重因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州金惠计算机系统工程有限公司,未经郑州金惠计算机系统工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510901348.2/1.html,转载请声明来源钻瓜专利网。