[发明专利]一种基于极少训练样本的深度图像哈希方法有效
申请号: | 201811053140.X | 申请日: | 2018-09-10 |
公开(公告)号: | CN109472282B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 耿立冰;潘炎;印鉴;赖韩江;潘文杰 | 申请(专利权)人: | 中山大学;广州中大南沙科技创新产业园有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 训练 样本 深度 图像 方法 | ||
1.一种基于训练样本的深度图像哈希方法,其特征在于,包括以下步骤:
S1:任务定义及数据划分;
S2:构建triplet-based通用深度哈希模型;
S3:基于通用深度哈希模型构建支持记忆体;
S4:通过双向长短期记忆子网络和支持记忆体学习极少样本的特征表示;
S5:训练极少样本下的深度图像哈希模型,并对极少样本的测试集进行检索测试;
所述步骤S1的具体过程是:
以cifar100数据集为样本,将cifar100划分为2部分,第一部分有80类,每一类有充足的500张训练图片,记作S;另外一部分有20类,每一类只有少量的3张或者5张、10张训练样本,该部分记作L,目的是训练一个深度哈希模型,使得属于这20类的图片能够在整个100类的图像数据库里进行相对有效的检索;
所述步骤S2的具体过程是:
S21:针对深度图像哈希的任务,首先需要构建特征学习子网络,即深度卷积网络,卷积网络由卷积层、激活层和池化层堆叠而成,具有强大的特征表达能力;
S22:经过卷积子网络后,每一张图片转换为一个语义特征向量,然后,特征向量后面加一个输出神经元数量为q的全连接层和相应的sigmoid激活函数层,每一个图像就转换为q维的、范围在0~1之间的实数向量,即哈希向量;
S23:得到哈希向量后,通过三元组损失函数(triplet ranking loss)进行约束,三元组损失函数的目的是通过学习,让相似图片的近似哈希向量之间的距离要远远小于不相似图片的哈希向量之间的距离;
S24:训练triplet-based的通用深度哈希网络,得到通用深度哈希模型;
所述步骤S3的具体过程是:
S31:从前面任务定义中,数据集有2部分,一部分是S,另一部分是L,S中每一类有充足的训练样本,可以对应于已经见过或者学习过的事物;L中训练样本很少,对应于新见到的事物;
S32:用训练好的triplet-based通用深度哈希模型对S中的样本进行特征提取,具体为:将样本I[i][j]依次输入到通用深度哈希模型,得到每一张图片的语义特征,其中1≤i≤s,1≤j≤n,s为S的种类数,n为每一类的样本数;
S33:将所有的特征排列为M[i][j],具体为:每一行i相同,表示该行的特征向量属于同一类,不同列表示该类第j个样本特征向量,M为支持记忆体。
2.根据权利要求1所述的基于训练样本的深度图像哈希方法,其特征在于,所述步骤S4的具体过程如下:
S41:在每一个迭代中,支持记忆体会按照指定顺序对每一类特征弹出一个特征向量,记作ft,1≤t≤s;
S42:双向长短期记忆子网络的正向和反向展开为s个time step;
S43:令fl作为双向长短期记忆子网络的时不变的输入xstatic,令ft作为双向长短期记忆子网络的时变的输入xt;
S44:经过双向长短期记忆子网络和支持记忆体的交互,得到极少新样本的最终特征表示;
S45:对新的特征表示用三元组损失函数进行约束。
3.根据权利要求2所述的基于训练样本的深度图像哈希方法,其特征在于,所述步骤S5的具体过程如下:
S51:用随机梯度下降的方法对整个网络进行训练;
S52:对L的测试集在整个图像数据库中进行检索,并计算测试结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;广州中大南沙科技创新产业园有限公司,未经中山大学;广州中大南沙科技创新产业园有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811053140.X/1.html,转载请声明来源钻瓜专利网。