[发明专利]一种基于主动学习的步态识别方法有效
申请号: | 202110041665.7 | 申请日: | 2021-01-13 |
公开(公告)号: | CN112818755B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 冯镔;胡滨;肖劲轩;刘文予 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V40/20;G06V10/774;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 向彬 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主动 学习 步态 识别 方法 | ||
1.一种基于主动学习的步态识别方法,其特征在于,所述方法包括下述步骤:
(1)生成轮廓数据集:
(1.1)对一段步态序列中的每一帧轮廓图,依据每一行的像素和不为0的原则,找上边和下边;
(1.2)根据上边和下边对轮廓图进行切割;
(1.3)对切割后的图进行resize操作,高度为64,宽度保持比例;
(1.4)依据每一列的和最大的为中心线原则,找到中心线;
(1.5)中心线左右各32像素进行切割,不够的补0;
(1.6)得到对齐后的轮廓图;
(2)初始化已标注集与未标注集:
将生成的轮廓数据集作为训练特征提取主模型和样本选择副模型的数据集,按照不同的应用场景选择相应的策略,对数据集进行初始化,当数据集样本数量庞大、需要高昂的代价进行人工标注时,初始化数据集的策略是:将轮廓数据集中已经进行了标注的数据设置为已标注集,轮廓数据集中未进行标注的数据设置为未标注集,当数据集样本数量有限、难以获取更多样本时,初始化数据集的策略是:随机从生成的轮廓数据集中选择一定数量的样本作为已标注集,其余的样本视为未标注样本,加入未标注集;
(3)训练特征提取主模型:
(3.1)将初始化好的已标注集样本输入到特征提取主模型当中,使用卷积神经网络和池化层,将已标注集样本从图像序列编码成具有代表性的特征;
(3.2)使用注意力机制,将每一个序列中最大的特征值、中间特征值和平均特征值进行叠加,作为每个序列在模型中的特征表示;
(3.3)得到每个序列的特征表示后,按照不同的尺度将特征进行分层叠加,得到序列多尺度的特征表示;
(3.4)使用损失函数对得到的特征进行评估,反向传播训练特征提取主模型;
(4)训练主动学习样本选择副模型:
(4.1)使用特征提取主模型提取好已标注集中样本的特征后,将提取好的特征输入到主动学习样本选择副模型当中,根据不同的应用场景,选择主动学习样本选择副模型的训练方式;
(4.2)当数据样本数量庞大,需要大量的标注,标注代价高昂,主动学习样本选择副模型的主要目的是降低标注代价时,根据特征提取主模型提取出的特征,主动学习样本选择副模型对已标注集中的每个样本预测不确定分数,以特征提取主模型的损失函数值作为真实值,计算主动学习样本选择副模型的损失函数值,反向传播进行训练;
(4.3)当数据集的数量比较有限、新样本获取困难,主动学习样本选择副模型的主要目的是充分利用数据样本的多样性时,根据特征提取主模型提取出的特征,主动学习样本选择副模型对已标注集中的样本预测目标标签,以每个样本的真实标签作为真实值,计算主动学习样本选择副模型的损失函数值,反向传播进行训练;
(5)更新已标注集与未标注集:
将训练好的特征提取主模型和主动学习样本选择副模型设置为测试模式,使用特征提取主模型提取未标注集中样本的特征,输入到主动学习样本选择副模型中,主动学习样本选择副模型对未标注集中每一个样本进行评估,按照设定好的选择策略,根据每个样本的不确定性分数或离相应目标标签特征中心距离的大小,将未标注数据集中的样本进行排序,选取K个样本进行标注后加入到已标注集中;
(6)重复步骤(3)到(5),直到已标注数据集中的样本数量达到预先设定好的容量。
2.根据权利要求1所述的基于主动学习的步态识别方法,其特征在于,所述步骤(3.3)中的损失函数的计算过程为:根据(3.1)中提取出的每个序列的特征,计算不同样本之间的距离,使标签相同的样本距离尽可能近,标签不同的样本距离尽可能远。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110041665.7/1.html,转载请声明来源钻瓜专利网。