[发明专利]一种自适应多任务深度学习的行人再识别方法有效
申请号: | 201911037649.X | 申请日: | 2019-10-29 |
公开(公告)号: | CN110765960B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 侯丽;刘琦;陈珍海;汪伟;曹俊呈 | 申请(专利权)人: | 黄山学院 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/764;G06V10/762;G06V10/774;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 苏州国诚专利代理有限公司 32293 | 代理人: | 韩凤 |
地址: | 245041 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 任务 深度 学习 行人 识别 方法 | ||
1.一种自适应多任务深度学习的行人再识别方法,其特征在于,包括以下步骤:
步骤1,从行人再识别基准数据集中选择用于行人身份信息识别的训练样本,从具有多种服装类别标注的服装属性数据集中选择用于行人服装属性分类的训练样本,一起用于行人身份和行人服装属性特征的联合学习;
步骤2,CNN基模型采用去除最后一层全连接层的VGG-19网络,其模型初始值采用大规模ImageNet图像集上已经训练好的VGG-19模型参数;
步骤3,初始化后的VGG-19网络,通过自顶向下逐层网络扩宽算法,将CNN基模型进行多轮扩宽;
步骤4,使用步骤1的训练样本,以固定的VGG-19扩宽网络作为多任务深度网络,应用多任务损失函数监督网络的训练,经过多次迭代不断地优化网络模型参数,从而获取用于行人再识别的优选模型,利用该模型进行行人再识别;所述多任务损失函数由行人身份学习的损失函数和行人服装属性学习的损失函数组成,共同监督指导行人特征在网络中的学习;
步骤3中,从初始化后的VGG-19网络顶层开始,执行自顶向下逐层网络扩宽,直到不再创建分支时,网络结构固定;
当VGG-19网络包含两轮扩宽时,扩宽VGG-19网络的第m层的方法如下,m代表1~18的自然数:
步骤3.1,执行VGG-19网络的第一轮扩宽:以VGG-19网络的第m层作为连接点,在连接点处进行网络扩宽,即在连接点处将网络分裂成不低于2个分支的独立子网络;设VGG-19网络的第m层包含k个分支输出;
步骤3.2,执行VGG-19网络的第二轮扩宽:设VGG-19网络的第m层输出的k个分支通过聚类算法聚成n组,2≤n≤k,这样VGG-19网络将在第m层扩宽为n个分支,促使VGG-19网络的第m-1层作为新的连接点,并在VGG-19网络的第m-1层产生n个分支的输出;
步骤3.3,构建VGG-19扩宽网络的损失函数:VGG-19扩宽网路的第m层分支数决定网络宽度,联合VGG-19扩宽网络的第m层的网络复杂度和各分支任务的分离度来构建VGG-19扩宽网络的损失函数,以获取VGG-19扩宽网络的第m层最佳的分支子网络;
当VGG-19网络包含两轮以上扩宽时,按照上述步骤3.1~3.3的两轮扩宽第m层的方法,进一步在第m-1层以及第m-1层以下若干层进行网络扩宽,直到在网络的某一层不再创建分支时为止,VGG-19扩宽网络结构固定。
2.根据权利要求1所述的自适应多任务深度学习的行人再识别方法,其特征在于,所述步骤2中,VGG-19网路结构由5组卷积层和2层全连接层组成,共18层,具体包括:
第1组卷积层由2个卷积层组成,每个卷积层输出64个特征平面;
第2组卷积层由2个卷积层组成,每个卷积层输出128个特征平面;
第3组卷积层由4个卷积层组成,每个卷积层输出256个特征平面;
第4组卷积层由4个卷积层组成,每个卷积层输出512个特征平面;
第5组卷积层由4个卷积层组成,每个卷积层输出512个特征平面;
第1个全连接层输出4096维特征向量;
第2个全连接层输出4096维特征向量。
3.根据权利要求1所述的自适应多任务深度学习的行人再识别方法,其特征在于,步骤4中,所述多任务损失函数L的公式为:
L=LId+LAttr,
其中表示行人身份信息学习的交叉熵损失函数,表示行人服装属性学习的交叉熵损失函数,N1表示行人的身份类别数,N2表示行人的服装属性类别数,yi表示真实的类别,表示预测的类别输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黄山学院,未经黄山学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911037649.X/1.html,转载请声明来源钻瓜专利网。