[发明专利]一种类别增量行为识别模型构建方法及行为识别方法在审
申请号: | 202111657111.6 | 申请日: | 2021-12-31 |
公开(公告)号: | CN115953653A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 谷洋;郭帅;陈益强;王记伟;文世杰;马媛 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06V10/778 | 分类号: | G06V10/778;G06V10/776;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 类别 增量 行为 识别 模型 构建 方法 | ||
1.一种基于知识重要性的类别增量行为识别模型构建方法,其特征在于,所述方法包括:
步骤(1)、获取适于进行增量学习并且经过训练的第一模型;
步骤(2)、对于原有数据{D1,…,Db-1}中的每个样例,计算所述第一模型对每个样例的预测值,对所述预测值进行校验,获得所述第一模型关于每一类样例的判断准确度,并基于所述第一模型关于每一类样例的判断准确度形成所述第一模型对原有数据{D1,…,Db-1}的知识重要性因子β;
步骤(3)、基于所述知识重要性因子β构建损失函数,将所述损失函数代入所述第一模型,根据目标增量类别数目,对所述第一模型进行类别增量,作为第二模型。
2.根据权利要求1所述的方法,其特征在于,所述第一模型基于下式计算其对每个样例的预测值:
其中,T是超参数,表示为蒸馏的温度值;是中的元素,表示所述第一模型对样例x进行预测时的该样例属于各个类别的概率输出。
3.根据权利要求2所述的方法,其特征在于,所述知识重要性因子β为:其中,表示第一模型对每个样例的预测值,代表在bth增量步骤中旧数据的类别数。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括对于基于样例所提取的特征向量进行余弦归一化。
5.根据权利要求3所述的方法,其特征在于,所述损失函数为:
L(x,y)=(1-β)LCE(x,y)+βLKD(x), (3)
其中,LCE表示交叉熵损失、LKD表示知识蒸馏损失。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括对于任意样例,若所述第一模型对其的预测值小于0,则将其预测值置为0。
7.根据权利要求1所述的方法,其特征在于,每次进行类别增量后,重复步骤(2)-(3),并且将上一循环中的第二模型作为第一模型。
8.一种利用权利要求1-7之一的方法构建的模型进行行为识别的方法,包括:
将被测样例数据代入所述第二模型进行行为识别,并且将新的样例数据更新到所述原有数据中,并重复所述步骤(2)-(3)。
9.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现根据权利要求1至8中任一项所述的方法。
10.一种计算机设备,包括存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至8中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111657111.6/1.html,转载请声明来源钻瓜专利网。