[发明专利]一种基于难样本混淆增强特征鲁棒性的行人重识别方法有效
申请号: | 202110028392.2 | 申请日: | 2021-01-13 |
公开(公告)号: | CN112668544B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 段继忠;郝玲 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 昆明明润知识产权代理事务所(普通合伙) 53215 | 代理人: | 马海红 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 样本 混淆 增强 特征 鲁棒性 行人 识别 方法 | ||
1.一种基于难样本混淆增强特征鲁棒性的行人重识别方法,其特征在于:包括以下步骤:
S1:设计特征提取模块:
提取有效的行人特征,首先设计如下身份损失函数Lid,用于将源域中的图片特征进行分类:
其中N为训练集中行人身份总数,m是行人的真实身份标签,pi为网络预测该行人属于标签i行人的概率,qi是通过每一张待查图片的ID标签得到,若m=i,则qi=1,而对于任何m≠i均有qi=0,对qi进行改写,具体过程如下:
上式中ε为平滑超参数,在训练时作为容错因子引入到交叉熵损失函数中;
S2:设计优化特征模块
为了使提取的行人图片特征特征得到优化,即同类图片在欧氏距离度量层面的距离更近,不同类图片的距离更远,加入了三元组损失函数进行约束,三元组Triplet由三张图片构成,分别命名为:锚点a,正样本p,负样本n,三元组损失函数表达如下:
Lt=(da,p-da,n+δ)+, (4)
δ是训练过程中设置的阈值参数,da,p和da,n作为度量函数,分别为锚点a与正样本p之间的欧氏距离、锚点a和负样本n之间的欧氏距离,上式表示括号内的数值与0相比较,选择大的数值作为损失函数的结果;在一个欧氏距离空间Rd中,度量学习的目的是得到一个能够将x映射到Rd中的函数f(x)以实现三元组学习的目标,具体表示如下:
其中是选定的一个样本作为锚点,和是通过欧氏距离选出来的正样本和负样本;
S3:在完成原始图像的特征提取和特征优化后,接下来就是找寻图像的难样本;给定一个锚点样本a表示该样本的身份,将其通过网络得到的特征与训练批次中其他身份的图像特征逐一进行距离度量,找到与最为相似的难样本,具体过程如下:
其中B为每个训练批次的图像数量,是与身份不同的样本,通过上式可以找到每张图像对应的难样本图像;
S4:在使用公式(7)找到了每一张作为锚点的图像的难样本,通过在图像层面进行难样本混淆,对于一张输入图像x1,通过公式(7)求解出其难样本,定义为x1-hard,再通过下式进行难样本混淆:
x1-new=x1×λ+x1-hard×(1-λ), (8)
其中x1-new为生成的含有难样本信息的混淆样本,λ是混淆因子;
S5:提取使模型更具鲁棒性的特征
通过上一步的训练过程找到目标图像所对应的难样本图像x1-hard,以此将所有的目标图像与其相对应的难样本图像进行混淆生成一批含有难样本信息的新图像,将生成的含有难样本信息的新图像重新利用S1节介绍的平滑交叉熵函数生成新的身份损失再有监督的训练网络,新的身份损失公式如下:
Lconfusion=Lid-new, (9)
Lid-new是对S4中求得的一批含有难样本信息的混淆样本图片使用S1中的公式(1)所得到的新的身份损失,并赋值给Lconfusion,后续出现的该参数均与此处意义保持一致;
S6:最后得到总体损失函数
从最开始输入到网络的原始数据,再使用难样本混淆得到新的一批实验数据,最后总体的损失函数表示如下:
Ltotal=Lid+Lt+β×Lconfusion, (10)
其中Lid是对原始图像数据采用交叉熵损失函数得到的身份损失,Lt是特征层面约束类内和类间距离进一步增强行人身份信息的三元组损失,Lconfusion是对难样本混淆之后得到的新数据进行交叉熵损失函数约束得到的另一个身份损失,超参数β用来衡量所提方法对整体性能的影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110028392.2/1.html,转载请声明来源钻瓜专利网。