[发明专利]一种类别增量行为识别模型构建方法及行为识别方法在审
申请号: | 202111657111.6 | 申请日: | 2021-12-31 |
公开(公告)号: | CN115953653A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 谷洋;郭帅;陈益强;王记伟;文世杰;马媛 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06V10/778 | 分类号: | G06V10/778;G06V10/776;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 类别 增量 行为 识别 模型 构建 方法 | ||
本发明公开了一种基于知识重要性的类别增量行为识别模型构建方法以及行为识别方法。本发明针对增量学习过程中灾难性遗忘和长尾数据集中类别不平衡的问题,首次提出了利用权重子集获得混合权重从而使教师模型自主识别重要性知识的判断方法,达到保留旧数据中的重要性知识,实现了在增量学习过程中,学生网络可以根据教师网络的判别效果自动更新自适应,从而在一定程度上缓解了灾难性遗忘问题;同时通过限制权重子集的范围,也解决了长尾数据集中类别不平衡的问题。
技术领域
本发明涉及人工智能领域,进一步涉及机器学习和行为识别领域,具体 涉及基于知识重要性的类别增量行为识别模型构建及行为识别方法。
背景技术
传统的可穿戴行为识别主要采用固定识别模型,也就是利用已有的有标 签数据离线训练分类模型,并利用该分类模型对个体行为进行分类识别。这 类模型在很多方面都是固定的,比如划定的类别数等。但是在真实环境中, 人们面临的场景是动态的,随着时间的延续,遇到的类别是在不断增加的, 比如个体这段时间学会了跑步,过一段时间后又学会了游泳。如何在开放环 境中完成用户在不断学习、识别新的行为的过程中,保存对已学过的行为的 记忆是在行为识别领域的一个重要挑战。
增量学习是适应开放场景下动态变化的一种有效方法,其模型构建方式 类似于人类对新事物的学习适应能力。增量学习是指在学得模型后,当新的、 之前从没见过的训练数据出现时,模型仅需要对新数据的特征进行适度的更 新,而不必重新训练整个模型,并且先前学习到的有效信息不会遗忘。理想 情况下的增量学习应满足:无需存储旧数据;对旧知识有足够的稳定性;对 新知识有足够的可塑性。但是在目前的研究过程中,灾难性遗忘是增量学习 中仍未完全解决的一大难题。
现有技术针对类别增量的行为识别大多都没有充分利用增量过程中新 旧知识之间的互补关系,例如中国专利CN201810354381.1提出了一种基于 随机森林实现行为识别中类别增量的方法,但是该方法并没有很好的解决增 量中灾难性遗忘的问题;中国专利CN201911325203.7设计了一种应用在机 器人上的自适应学习方法,可以通过机器人自适应过程中实现行为识别;中 国专利CN201810102422.8采用多源数据融合和室内定位的方法实现行为识 别;中国专利CN112990280-A在图像分类问题上采用了类别增量的方法。 美国专利US2020302230-A1则是将类别增量学习应用到了目标检测领域上。 但是这些方法也都没有解决增量中灾难性遗忘的问题。
传统的基于知识蒸馏的方法在bth增量步骤中,使用上一步学到的参数初 始化模型,并添加新的输出节点,其中,全连接层的权重是随机初始化的。 之后,模型会在输入数据为新数据Db和一部分旧数据的情况下学会分别 新类,并同时保留对原有类别的判断能力,其中新数据Db来自新类Cb,旧 数据来自旧类其中
传统的基于知识蒸馏的方法采用交叉熵损失(Cross-Entropy Loss)LCE和 知识蒸馏损失(Knowledge Distillation Loss)LKD。
然而,即便是采用了基于知识蒸馏和交叉熵损失技术,基于类别增量的 行为识别技术在实际应用中仍存在增量学习过程中产生灾难性遗忘的问题 等挑战。目前广泛采用的将蒸馏损失与交叉熵损失共同作为损失函数的方法 具有以下缺点:1.没有充分判断教师模型对旧知识的处理能力。2.由于增量 过程中新旧类存在类别不平衡的问题,可能会导致模型对新数据的学习效果 特别好,而同时增加了对旧知识的遗忘程度。3.由于增量过程中新旧类之间 不仅存在差异,也存在一定的联系性,如何更有效的学习新知识也是当前亟需解决的一个问题。
所以研究如何在增量过程中平衡新旧类、减少模型对旧知识的遗忘程度, 在学习新知识的同时从新旧类之间的联系上更好地学习新知识是有重要意 义和应用价值的。需要一种鲁棒性更高,能够在缓解灾难性遗忘的情况下学 习新知识并同时对新知识有较好的学习效果的模型。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111657111.6/2.html,转载请声明来源钻瓜专利网。