[发明专利]一种基于深度学习的服装检索方法有效
申请号: | 201910530599.2 | 申请日: | 2019-06-19 |
公开(公告)号: | CN110263252B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 全红艳;王振 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/532;G06N3/04;G06N3/06;G06N3/08 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 服装 检索 方法 | ||
1.一种基于深度学习的服装检索方法,其特征在于,该方法输入分辨率为f×f的RGB图像I,100≤f≤1000,具体包括以下步骤:
步骤1:构建服装数据集F
从taobao.com网站收集J个单件服装样例,10000≤J≤15000,将收集的J个单件服装样例与http://mmlab.ie.cuhk.edu.hk/projects/DeepFashion.html提供的DeepFashion数据集合并,得到包含有M个单件服装样例的初始数据集T,80000≤M≤100000,利用T构建服装样例数据集R,R中服装种类数目为U,15≤U≤20,每个服装样例是同一件服装的采样信息,其包含三类信息:具有环境背景的一幅服装图像B、该服装无环境背景的多幅图像{Ek|2≤k≤10}以及此件服装的种类标签Oi,1≤i≤U;
构建服装数据集F:F的每个样本的形式定义为三元组(Pi,Qi,li),1≤i≤500000,其中,Pi是从R中选取的B,将其尺度缩放为N×N,N为227、454或者908,Qi是从R中选取的任意样例数据的无环境背景服装图像,将其尺度也缩放为N×N,li是Pi与Qi相似性标签,li取值为0或者1,当Pi与Qi来自于R的同一组样例时,即是相同服装的两幅图像时,li取1,否则取0;
步骤2:构建神经网络
神经网络构建分为服装特征学习网络F-Net及相似性学习网络S-Net;
对于F-Net,先从F中选取Pi或者Qi作为输入,其尺度为227×227,张量形状为227×227×3,F-Net网络的输出有两个部分:一个是来自于F-Net中间层的哈希编码,即Pi的哈希编码Hp或者Qi的哈希编码HQ,张量形状为h×1,h为64、128或者256,另一个输出是网络最后一层输出的Pi或者Qi的服装类别特征,张量形状为U×1;
对于S-Net,输入的是两个哈希编码Hp及HQ,输出的是Pi与Qi相似性的比对结果C,其张量形状为2×1,张量的两个分量分别表示Pi与Qi之间的相似程度及不相似程度,相似程度记为评分V;
对于F-Net设置为5个卷积层和4个全连接层,对于前三层卷积得到的特征分别增加一个偏移量,偏移量的张量尺度与特征尺度相同;
5个卷积层设计为5个卷积子结构,各层卷积核的个数依次为96、256、384、384、256,前3个子结构都包括以下序列操作:卷积、批归一化、加上偏移量、激活、最大池化,后2个子结构都包括以下序列操作:卷积、激活、最大池化,4个全连接层的神经元的个数分别为4096、4096、h、U,倒数第二层全连接层的神经元个数为h,这一层得到的特征是输入图像的哈希编码结果,最后一层全连接层的神经元个数为U,这一层输出的特征是服装类别特征,F-Net中都采用ReLU激活函数进行处理;
对于S-Net设置为3层全连接结构,神经元的个数分别为G、G、2,其中G为512、1024或者2048,前两个全连接层输出的结果进一步采用ReLU函数进行激活;
步骤3:神经网络的训练
将数据集F中的样本按照7∶1∶2比例划分为训练数据集,评估数据集和测试数据集,利用训练数据集训练网络模型,利用评估数据集评估训练过程中网络的性能,利用测试数据集对网络性能进行测试;
首先对F-Net训练50000轮次,训练结束后,再对S-Net进行训练50000轮次,在训练S-Net时,每次训练过程需要输入的是Pi及Qi的编码HP和HQ;
在对F-Net进行训练时,损失函数eF定义为:
其中,ai是F-Net在最后一个全连接层的U个神经元中得到的第i个类别特征;
在对S-Net进行训练时,损失函数eS定义为:
其中,bi是S-Net在最后一个全连接层的2个神经元中得到的类别特征,其形状为2×1,yi表示Pi及Qi的相似性,yi形状为2×1,它的两个分量分别表示Pi与Qi之间的相似程度及不相似程度的标签,如果相似,相似程度的分量取1,不相似程度的分量取0,而当Pi与Qi不相似时,相似程度的分量取0,不相似程度的分量取1;
步骤4:服装检索操作
构建一个服装检索数据集S,其中服装分辨率为f×f,100≤f≤1000,将S中的每一幅服装图像都缩放为227×227,再将S中的每幅图像依次输入到F-Net,分别得到每幅图像的哈希编码,并写入磁盘文件code.txt进行保存;
从数据集S中选取I,根据I到磁盘文件code.txt中检索I的哈希编码K,K与磁盘文件code.txt中每个服装的哈希编码,分别多个哈希编码对,将这些哈希编码对依次输入到S-Net中进行预测,得到每次比对的相似性评分,再将这些评分进行降序排列,从中选取最优的检索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910530599.2/1.html,转载请声明来源钻瓜专利网。