[发明专利]基于半监督学习的行人再识别方法及装置有效
申请号: | 202010314162.8 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111563424B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 韩剑;王生进;李亚利 | 申请(专利权)人: | 清华大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/778;G06V10/774;G06V10/764;G06V10/82;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郭亮 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 行人 识别 方法 装置 | ||
1.一种基于半监督学习的行人再识别方法,其特征在于,包括:
将多个已标注的有标签行人图像序列,作为初始训练集,输入预设的行人再识别模型,进行初步训练;
从多个无标签的图像序列中,选取置信度满足预设条件的图像序列,对于每一选取的图像序列,将特征空间中最邻近的有标签图像序列的标签作为伪标签,从而得到多个选取图像序列构成的支持集;
将支持集中的图像序列,输入预设的行人再识别模型进行再次训练;基于再次训练得到的模型进行行人再识别;
其中,所述置信度表示无标签图像序列与有标签图像序列在特征空间的邻近程度;
所述将支持集中的图像序列,输入预设的行人再识别模型进行再次训练之后,还包括:
将带有伪标签的无标签图像序列作为已标注的有标签图像序列;
重复执行上述从多个无标签的图像序列中,选取置信度满足预设条件的图像序列,并将特征空间最邻近的有标签图像序列的标签作为伪标签,得到支持集,输入预设的行人再识别模型进行再次训练,以及将带有伪标签的无标签图像序列作为已标注的有标签图像序列过程,直至预设次数或满足预设收敛条件;
所述选取置信度满足预设条件的图像序列之前,还包括:
设置预设比例,并设置初始置信度阈值;
相应地,选取置信度满足预设条件的图像序列,具体为:
对于首次迭代,选取置信度大于初始置信度阈值的图像序列,以使选取的无标签序列占有标签序列的比例满足所述预设比例;
对于非首次迭代,若支持集增量的变化速率小于预设动态切换因子,则在上次迭代的置信度阈值的基础上叠加增量,得到新的置信度阈值用于本次迭代;
其中,所述预设动态切换因子随每次迭代的置信度阈值增大而减小。
2.根据权利要求1所述的基于半监督学习的行人再识别方法,其特征在于,所述选取置信度满足预设条件的图像序列之前,还包括:
根据类内距离和最小的类间距离的比值,确定每一无标签图像序列的置信度;
其中,所述类间距离为有标签的图像序列之间在特征空间的距离,所述类内距离为无标签图像序列与特征空间中最邻近的有标签图像序列之间的距离。
3.根据权利要求1所述的基于半监督学习的行人再识别方法,其特征在于,将初始训练集或支持集,输入预设的行人再识别模型,包括:
将初始训练集或支持集中的图像序列,分别输入主干网络进行特征提取,得到和序列帧数对应的特征图;
将所述特征图依次输入全局池化层、全连接层以及一维的批归一化层进行降维,然后输入时域平均池化层,将T帧的特征进行融合,得到全局特征;
同时,将所述特征图按头部、上身、腿部和脚部在竖直方向的比例,将所述特征图拆分为四个部分,依次输入局部池化层、全连接层以及一维的批归一化层进行降维,然后输入时域平均池化层,将T帧的特征进行融合,得到四个部位的局部特征;
将所述全局特征和所述局部特征级联,经归一化后,作为序列的特征,用于训练。
4.根据权利要求3所述的基于半监督学习的行人再识别方法,其特征在于,所述头部、上身、腿部和脚部在竖直方向的比例为1:2:2:1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010314162.8/1.html,转载请声明来源钻瓜专利网。