[发明专利]深度学习分类模型的训练装置和方法有效
申请号: | 201710798596.8 | 申请日: | 2017-09-07 |
公开(公告)号: | CN109472274B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 刘晓青;谭志明 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 日本神奈*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 学习 分类 模型 训练 装置 方法 | ||
1.一种深度学习图像分类模型的训练装置,其特征在于,所述训练装置包括:
属性生成单元,其基于目标图像数据的目标属性生成多个相关属性;其中所述目标图像数据的目标属性对应一训练主干,所述目标图像数据的所述多个相关属性对应多个相关训练分支,所述目标属性包括人物的服饰类型,所述多个相关属性包括人物造型、人物拍照时的光线条件和人物拍照时的相机视角;
数据生成单元,其基于所述目标图像数据以及训练数据集生成相似图像数据;其中所述相似图像数据的目标属性对应一相似训练分支;
训练单元,其针对所述训练主干、所述相似训练分支和多个所述相关训练分支,分别进行包括特征提取和属性分类的训练;以及
参数调整单元,其基于分别训练的结果对所述特征提取的参数和/或所述属性分类的参数进行调整,以对整个网络模型进行训练。
2.根据权利要求1所述的训练装置,其中,所述属性生成单元通过对所述目标图像数据增加标注而获得所述多个相关属性;
所述数据生成单元通过从所述训练数据集中选择多个样本数据而获得所述相似图像数据;其中所述相似图像数据中的一部分样本数据的所述目标属性的值与所述目标图像数据中的一部分样本数据的所述目标属性的值相同。
3.根据权利要求1所述的训练装置,其中,所述训练装置还包括:
标签集生成单元,其针对所述训练主干生成一主干标签集,针对多个所述相关训练分支生成多个相关标签集,以及针对所述相似训练分支生成一相似标签集。
4.根据权利要求3所述的训练装置,其中,在所述训练主干、所述相似训练分支和所述相关训练分支中,多个所述特征提取共享并使用预先训练得到的一个或多个初始参数。
5.根据权利要求3所述的训练装置,其中,所述训练装置还包括:
相似度计算单元,其根据所述相似训练分支中的所述属性分类的结果以及所述训练主干中的所述属性分类的结果,计算所述目标图像数据和所述相似图像数据关于所述目标属性的相似度。
6.根据权利要求5所述的训练装置,其中,所述训练装置还包括:
损耗计算单元,其根据所述相似度以及所述相似标签集来计算所述相似训练分支所对应的相似分支损耗,根据所述训练主干中的所述属性分类的结果以及所述主干标签集来计算所述训练主干所对应的主干损耗,根据所述相关训练分支中的所述属性分类的结果以及所述相关标签集来计算所述相关训练分支所对应的相关分支损耗。
7.根据权利要求6所述的训练装置,其中,所述训练装置还包括:
加权计算单元,其基于所述相似分支损耗、所述主干损耗以及多个所述相关分支损耗,计算加权后的损耗值;并且
所述参数调整单元还用于:基于所述加权后的损耗值,更新所述训练主干、多个所述相关训练分支和所述相似训练分支中的所述特征提取的参数和/或所述属性分类的参数。
8.根据权利要求5所述的训练装置,其中,所述训练装置还包括:
距离计算单元,其根据所述训练主干的所述属性分类的结果,计算具有所述目标属性的样本数据之间的特征距离;以及
阈值设置单元,其基于所述特征距离设置相似度阈值;
并且,所述相似度计算单元还用于:基于所述相似度阈值对所述目标图像数据和所述相似图像数据关于所述目标属性的相似度进行更新。
9.根据权利要求8所述的训练装置,其中,所述训练单元还用于:基于不同的所述相似度阈值,迭代地对所述整个网络模型进行训练。
10.一种深度学习图像分类模型的训练方法,其特征在于,所述训练方法包括:
基于目标图像数据的目标属性生成多个相关属性;其中所述目标图像数据的目标属性对应一训练主干,所述目标图像数据的所述多个相关属性对应多个相关训练分支,所述目标属性包括人物的服饰类型,所述多个相关属性包括人物造型、人物拍照时的光线条件和人物拍照时的相机视角;
基于所述目标图像数据以及训练数据集生成相似图像数据;其中所述相似图像数据的目标属性对应一相似训练分支;
针对所述训练主干、所述相似训练分支和多个所述相关训练分支,分别进行包括特征提取和属性分类的训练;以及
基于分别训练的结果对所述特征提取的参数和/或所述属性分类的参数进行调整,以对整个网络模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710798596.8/1.html,转载请声明来源钻瓜专利网。