[发明专利]一种基于深度学习的服饰属性标签识别方法在审
申请号: | 202010165246.X | 申请日: | 2020-03-11 |
公开(公告)号: | CN111400527A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 徐旭东;刘鑫 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06F16/583;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 服饰 属性 标签 识别 方法 | ||
1.一种基于深度学习的服饰属性标签识别方法,用于完成对服饰图像属性值的识别,其中训练涉及的数据集包含两部分,一部分为图像数据,一部分为图像对应的标注文件,其中图像数据为按属性维度划分的n类图像数据;标注文件包括对应图像的存储路径,对应图像的属性维度,对应图像属性维度对应的属性值,其特征在于该方法还依次包含以下步骤:
步骤(1)对训练数据集进行初步分类,并完成对数据图像的预处理,其中所述的数据集初步分类指按属性维度将数据集分为长度层面数据集和设计层面数据集;
步骤(2)将步骤(1)得到的长度层面数据集进行平铺数据和非平铺数的分类,得到长度平铺数据集和长度非平铺数据集,所述的非平铺数据为图像中包含人体结构的数据,反之为平铺数据;
步骤(3)使用步骤(1)得到的设计层面数据集进行训练,建立设计层面的n个识别模型,所述设计层面的识别模型用于识别输入图像在设计层面的属性值;所述n个识别模型的区别仅在于所选基网络不同;
步骤(4)使用步骤(2)长度平铺数据和长度非平铺数据进行训练,建立长度层面的n个识别模型,所述长度层面的识别模型用于识别输入图像在长度层面的属性值;
步骤(5)建立预测模型,对待预测图像进行预测,包括对待预测图像进行设计层面的属性预测以及长度层面的属性预测两部分。
2.根据权利要求1所述的一种基于深度学习的服饰属性标签识别方法,其特征在于:
步骤1所述的数据预处理包含计算所有图像的RGB的std标准差与mean平均值,数据分辨率的选取,以及数据增强的使用。
3.根据权利要求1所述的一种基于深度学习的服饰属性标签识别方法,其特征在于:
步骤2中平铺数据和非平铺数据分类过程具体为:长度层面数据集经过Jpp Net框架完成平铺数据和非平铺数据的初步分类;接下来,对初步分类结果进行二次优化筛选,最终得到长度平铺数据集和长度非平铺数据集。
4.根据权利要求3所述的一种基于深度学习的服饰属性标签识别方法,其特征在于:
所述的二次优化筛选具体为,使用MaskRCNN和JppNet并行同时训练,对属性维度是衣长和袖长的非平铺图像进行复筛;使用MaskRCNN对于属性维度是裙长和裤长的非平铺图像进行复筛。
5.根据权利要求3所述的一种基于深度学习的服饰属性标签识别方法,其特征在于:
所述的JppNet框架和MaskRCNN框架的基网络优选ResNet50。
6.根据权利要求1所述的一种基于深度学习的服饰属性标签识别方法,其特征在于:所述设计层面识别模型的建立过程具体如下:
使用步骤(1)得到的均值和标准差对步骤(1)得到的设计层面数据集进行标准化;
然后导入基网络,冻结网络层;添加池化层和Dropout来防止过拟合;根据属性维度和属性值的映射关系,索引到输入数据的属性维度所对应的属性值,并传给SoftMax进行分类,使用优化器优化,采用交叉熵为损失函数完成训练,生成设计层面识别模型,得到模型权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010165246.X/1.html,转载请声明来源钻瓜专利网。