[发明专利]一种基于领域增量学习的语义分割方法在审
申请号: | 202310185511.4 | 申请日: | 2023-03-01 |
公开(公告)号: | CN116091776A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 刘亚洲;陈浩琦;冯锋 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/774;G06V10/82;G06N3/08 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 领域 增量 学习 语义 分割 方法 | ||
1.一种基于领域增量学习的语义分割方法,其特征在于,包括如下步骤:
1)准备新任务数据,对于当前第t个领域增量任务,准备新领域t的训练数据,以及领域1至领域t的测试数据,分别用于方法的训练和测试;
2)构建新任务的模型且对其初始化;
3)将训练数据输入模型中,获得模型对不同领域的响应并计算损失;
4)模型迭代训练,将新任务数据集中的训练数据同时输入到新旧模型中,通过损失函数训练模型,得到训练完成的模型;
5)模型测试,分别将新旧领域的测试集输入到训练完成的模型中进行前向传播,测试模型分别在新旧领域的性能。
2.根据权利要求1所述的基于领域增量学习的语义分割方法,其特征在于,所述步骤1)准备新任务数据,具体实现如下:
对于领域增量学习任务,模型需要在多个领域上进行增量式学习,需要准备多个领域的数据;使用的是语义分割任务中常用的Cityscapes数据集,BDD数据集,IDD数据集和ACDC数据集,基于上述4个数据集来准备新任务的数据,用于模型的训练和测试。
3.根据权利要求1所述的基于领域增量学习的语义分割方法,其特征在于,所述步骤2)构建新任务的模型且对其初始化,具体实现如下:
21)对于第1个领域增量任务,新模型的构建是基于原始的语义分割模型,在其主干上增加一组领域特定参数:领域适配器,参数重加权模块;对于当前第t个领域增量任务,新模型是基于先前第t–1领域增量任务中获得的模型进行构建,在其主干上增加一组新的领域特定参数:领域适配器,参数重加权模块,批归一化层,领域特定的解码器;
22)对于第1个领域增量任务,新模型通过加载在ImageNet上预训练的权重进行模型参数的初始化;对于当前第t个领域增量任务中构建的模型,通过加载先前第t–1领域增量任务中获得的模型参数权重进行初始化;
23)在模型开始训练前,将在先前第t–1领域增量任务中获得的旧模型参数权重进行冻结,新模型中在先前增量任务中学习到的旧领域的领域特定参数权重也被冻结,只有新领域的领域特定参数以及领域共享参数是可训练的。
4.根据权利要求1所述的基于领域增量学习的语义分割方法,其特征在于,所述步骤3)将训练数据输入模型中,获得模型对不同领域的响应并计算损失,包括以下步骤:
31)将训练数据输入到旧模型中,通过加载旧模型的领域共享参数以及任一旧领域的领域特定参数,能够获得旧模型对该旧领域的特征响应,最终能够获得旧模型对所有旧领域的特征响应;
32)将训练数据输入到新模型中,通过加载新模型的领域共享参数以及任一领域的领域特定参数,能够获得新模型对该领域的特征响应,最终能够获得新模型对所有新旧领域的特征响应;
33)根据上述步骤获得的特征分别计算分割损失和蒸馏损失。
5.根据权利要求4所述的基于领域增量学习的语义分割方法,其特征在于,所述步骤31)具体实现如下:
对于当前第t个领域增量任务,将训练数据输入到旧模型,通过加载旧模型的领域共享参数以及任一旧领域的领域特定参数,能够获得旧模型对该旧领域的特征响应,最终能够得到对此前t-1个旧领域的中间特征和预测输出。
6.根据权利要求4所述的基于领域增量学习的语义分割方法,其特征在于,所述步骤32)具体实现如下:
对于当前第t个领域增量任务,将训练数据输入到新模型,通过加载新模型的领域共享参数以及任一领域的领域特定参数,能够获得新模型对该领域的特征响应,最终能够得到对所有t个新旧领域的中间特征和预测输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310185511.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:交易处理方法、装置、设备及存储介质
- 下一篇:一种酯交换催化剂及回收方法