[发明专利]一种基于丢弃损失函数的人物属性识别方法有效
申请号: | 202011116242.9 | 申请日: | 2020-10-19 |
公开(公告)号: | CN112200260B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 严严;许友泽;王菡子 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 丢弃 损失 函数 人物属性 识别 方法 | ||
1.一种基于丢弃损失函数的人物属性识别方法,其特征在于,包括以下步骤:
A.准备样本集,并划分为训练样本集与验证样本集,具体步骤为:
A1.获取样本对应的属性识别标注,获取样本集中的划分标准;
A2.将获得的样本集及其对应的属性识别标注整合一起,并按照样本集中的划分标准将其划分为训练样本集与验证样本集:训练样本集表示为N为训练样本数,而验证样本集表示为M为数据集中的属性个数,其中attr_q为属性的总类别数,N,M,attr_q为自然数,表示训练样本对应的固定大小的图像;表示训练样本具有的属性类别:
B.设计基于ResNet-50的深度卷积神经网络,对于训练集中的每幅输入图像,通过设计的神经网络得到固定维度的特征;
C.设计丢弃损失函数中包含的离群样本丢弃策略,在通过设计的深度卷积神经网络得到每个属性的特征之后,根据属性的特征计算其对应的梯度值,选择性地丢弃梯度值大于一定阈值的样本权重,这种方式能够适应性地处理不平衡的离群样本问题;
D.设计丢弃损失函数中包含的样本加权丢弃策略,基于离群样本丢弃策略中未被丢弃的样本集与其对应的梯度值,选择性地丢弃其梯度值最小的一部分样本,并在此基础上,通过对样本加权的方式来平衡其正负类别样本的分布;
所述设计丢弃损失函数中包含的样本加权丢弃策略,基于离群样本丢弃策略中未被丢弃的样本集与其对应的梯度值,选择性地丢弃其梯度值最小的一部分样本,并在此基础上,通过对样本加权的方式来平衡其正负类别样本的分布的具体步骤为:
D1.样本加权丢弃策略首先对极端简单多数类样本集合进行定义,给定一个已经丢弃完离群样本后的批次训练样本集代表的是第j个属性的多数类训练样本集,代表的是第j个属性的少数类样本集,对于第j个属性而言,其具有的极端简单多数类样本集定义为:
其中,k代表极端简单样本的梯度阈值,Ii表示训练样本集中的第i个样本,为Ii所对应的第j个属性的梯度值,将所有极端简单多数类样本集的权重进行丢弃,即其损失不会计入总体的损失内;此时丢弃后的批次训练样本集为代表的是第j个属性的未被丢弃的多数类样本集,
D2.再根据未被丢弃的类别样本个数对未被丢弃的样本进行加权,此时权重大小定义为:
其中,代表的是现存批次训练样本集中未被丢弃的第i个样本;将权重带入sigmoid cross-entropy损失函数中,得新的损失函数为:
其中,为现存批次训练样本集中未被丢弃的第i个样本的第j个属性的模型输出,代表的是sigmoid cross-entropy损失函数计算公式;
最终得到丢弃损失函数定义为:
E.将训练样本集中的所有图像放进设计的基于ResNet-50的深度卷积神经网络里使用设计的丢弃损失函数计算得到总体损失,并利用反向传播算法进行端到端的训练,得到训练好的模型;
F.利用训练好的模型进行多属性识别,神经网络输出的特征即为识别结果。
2.如权利要求1所述一种基于丢弃损失函数的人物属性识别方法,其特征在于,在步骤B中,所述设计基于ResNet-50的深度卷积神经网络,对于训练集中的每幅输入图像,通过设计的神经网络得到固定维度的特征的具体步骤为:
B1.设计基于ResNet-50的深度卷积神经网络,使用ResNet-50网络中的卷积部分用来提取输入的图片的特征,去除ResNet-50中最后的全连接分类层后,新增一层大小为2048*attr_q的全连接分类层;
B2.对所有的原始图像的归一化大小为一定的尺寸,对于CelebA数据集,归一化大小为178*216,对于Market-1501行人数据集归一化大小为288*144;
B3.对于训练集中的每幅预处理的输入图像,将其输入到设计的神经网络中,得到attr_q维的特征向量,每个特征值分别对应着每个属性的特征。
3.如权利要求2所述一种基于丢弃损失函数的人物属性识别方法,其特征在于,在步骤C中,所述设计丢弃损失函数中包含的离群样本丢弃策略,在通过设计的深度卷积神经网络得到每个属性的特征之后,根据属性的特征计算其对应的梯度值,选择性地丢弃梯度值大于一定阈值的样本权重的具体步骤为:
C1.选定离群样本候选集,在训练过程中,每个属性都具有一个离群样本候选集;给定一个批次训练样本集T,其中第i个样本Ιi,如果其梯度大于一定阈值,则将其加入离群样本候选集,对第j个属性的离群样本候选集而言,其定义如下:
其中,代表的第i个样本的第j个属性的模型输出,代表第i个样本的第j个属性的梯度,来自算法GHM-C所定义的梯度概念,α代表离群样本候选集的阈值,对于离群样本候选集而言,按照概率的形式进行丢弃其权重;
C2.计算每个属性对应的丢弃率,在得到每个属性的离群样本候选集之后,需要考虑每个属性的离群样本候选集的丢弃比率,使用损失的相对大小来设计丢弃率,考虑传统的sigmoid cross-entropy损失函数,得到当前批次的各个属性的损失,对于第j个属性的批次损失大小如下:
其中,n表示当前批次的数目,代表第i个样本的第j个属性的模型预测值,代表第i个样本的第j个属性的正确标签,得到属性的批次损失大小后,需要对所有属性的批次损失进行归一化,采用min-max normalization正则函数,得到当前批次的各个属性的丢弃概率,第j个属性的丢弃率计算公式如下:
C3.根据每个属性的丢弃率,对属性对应的离群样本候选集按前面计算的丢弃比例进行按比例丢弃,得到丢弃样本集此时对于第j个属性,其现有的批次训练样本集为现有的批次训练样本集为此时的丢弃损失函数计算公式如下:
其中,代表第j个属性的现有的批次训练样本集,为现有训练样本集中第i个样本的第j个属性的预测值,为其对应的正确标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011116242.9/1.html,转载请声明来源钻瓜专利网。