[发明专利]一种自适应难例挖掘的行人重识别方法与系统有效
申请号: | 201810323425.4 | 申请日: | 2018-04-10 |
公开(公告)号: | CN108647577B | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 桑农;陈科舟;陈洋;韩楚楚;高常鑫;王若林 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 挖掘 行人 识别 方法 系统 | ||
本发明公开了一种自适应难例挖掘的行人重识别模型、方法与系统,其中,识别方法包括:将样本图片随机分成每次迭代使用的训练集合,将训练集合输入卷积神经网络,利用softmax函数得到每个样本对属于正、负样本对的概率,进而利用多项逻辑斯蒂函数得到每个样本对的损失;利用每个样本对的损失获取难例样本对;利用难例样本对训练卷积神经网络,直到当前迭代次数达到迭代次数上限,得到行人重识别模型。利用行人重识别模型提取待识别图片集的中每个图片的特征,进而得到待识别图片集中样本对的相似度排序。本发明不存在过拟合、欠拟合、且识别准确率高。
技术领域
本发明属于模式识别技术领域,更具体地,涉及一种自适应难例挖掘的行人重识别模型、方法与系统。
背景技术
行人的重识别算法是图像处理和模式识别研究的重要领域之一。所谓行人的重识别,是指将某个待定的被搜索的目标行人作为搜索的源,在其他的摄像头拍摄视频自动地找到同一目标的算法,其主要难点在于目标在不同场景下受光照、视角、遮挡等干扰因素的影响呈现出极大的类内差异。随着深度学习技术的发展,行人重识别算法的精度较之于手工特征和度量学习等传统方法有了长足的进步。但是,深度学习训练所需要的样本数量巨大,且对于行人重识别任务,容易分类的训练样本的数量往往远大于难以正确分类的训练样本(难例样本)的数量,现有技术没有充分考虑难例样本,而往往过多的简单样本对反而会导致深度卷积神经网络的过拟合现象发生,大多数算法在训练的每次迭代过程中选择一定量的难例样本用来更新网络。然而,在训练初始阶段,网络还未完全收敛,过度强调挖掘难例样会导致网络因为样本数量减少而产生欠拟合现象。
由此可见,现有技术存在过拟合、欠拟合、识别准确率低的技术问题。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种自适应难例挖掘的行人重识别模型、方法与系统,由此解决现有技术存在过拟合、欠拟合、识别准确率低的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种自适应难例挖掘的行人重识别模型的训练方法,包括:
(1)采集样本图片,将样本图片随机分成每次迭代使用的训练集合,将每个训练集合中的所有样本图像两两分组,得到多个样本对,若样本对中两张样本图像来自同一目标行人则该样本对的真实标签为正样本对,否则该样本对的真实标签为负样本对;
(2)将第一次迭代的训练集合输入卷积神经网络,利用softmax函数得到每个样本对属于正、负样本对的概率,进而利用多项逻辑斯蒂函数得到每个样本对的损失;
(3)对于每个训练集合中所有样本对的损失从大到小排列得到集合S,并计算每个训练集合的总损失L,利用每个训练集合的总损失L与一个自适应的难例阈值相乘得到每个训练集合的难例样本对的损失和的阈值β,当集合S中前m个样本对的损失和超过阈值β时,集合S中前m个样本对构成难例样本对集合H;
(4)利用难例样本对集合H向前传播训练卷积神经网络,利用难例样本对集合H中难例样本对的损失在卷积神经网络中反向传播来更新卷积神经网络的参数;
(5)将第A次迭代的训练集合输入卷积神经网络,A≥2,然后重复步骤(2)-(4),直到当前迭代次数达到迭代次数上限,卷积神经网络训练完成,得到行人重识别模型。
进一步地,步骤(2)中每个样本对的损失为:
其中,为样本对pi的损失,Z={z0,z1}表示每个样本对属于正、负样本对的概率,zy为样本对的真实标签,zy为0或者1。
进一步地,一个自适应的难例阈值为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810323425.4/2.html,转载请声明来源钻瓜专利网。