[发明专利]跨域自适应语义分割方法及系统有效
申请号: | 202110511242.7 | 申请日: | 2021-05-11 |
公开(公告)号: | CN113221903B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 张兆翔;宋纯锋;王玉玺 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应 语义 分割 方法 系统 | ||
1.一种跨域自适应语义分割方法,其特征在于,所述跨域自适应语义分割方法包括:
获取不同域训练数据集,所述训练数据集包括有标签的源域数据和无标签的目标域数据;
执行以下操作,对所述训练数据集进行迭代训练,建立熵值预测模型:
针对每一次迭代,基于对抗学习网络,根据所述源域数据及目标域数据,得到第一预测模型;
根据所述第一预测模型,确定所述目标域数据中各类别的平均熵;
筛选出平均熵最高的K个类别的目标域数据,采用软采样方法进行重采样;
根据重采样数据,得到第二预测模型;
根据所述第二预测模型,再次计算筛选出的K个类别的目标域数据的平均熵,确定是否有变化,如果有变化,则调整模型参数,进行下次迭代,直至得到迭代阈值结束;如果没有变化,则当前的第二预测模型为熵值预测模型;
根据所述熵值预测模型,计算所述目标域数据的熵值;
对各熵值进行多元高斯拟合,通过最大期望算法,得到两个峰值的高斯分布;
根据所述高斯分布,确定目标域数据的伪标签;
根据目标域的伪标签,重新训练目标域数据,构造基于伪标签的语义分割模型;
基于所述语义分割模型,对待处理数据,进行语义分割。
2.根据权利要求1所述的跨域自适应语义分割方法,其特征在于,所述基于对抗学习网络,根据所述源域数据及目标域数据,得到第一预测模型,具体包括:
根据所述源域数据及对应的标签,构造语义分割损失函数;
基于对抗学习网络,根据所述源域数据及目标域数据,确定对抗学习损失函数;
基于语义分割损失函数、对抗学习损失函数,及所述目标域数据,确定第一预测模型。
3.根据权利要求2所述的跨域自适应语义分割方法,其特征在于,根据以下公式,确定语义分割损失函数Lseg(xs,ys):
其中,H表示源域图像的长,W表示源域图像的宽,C表示源域图像的类别;h,w表示像素位置,c表示该像素类别,xs表示源域图像,ys表示源域图像xs对应的标签数据,表示在位置(h,w)处类别c的值,表示位置(h,w)处类别c的预测结果。
4.根据权利要求2所述的跨域自适应语义分割方法,其特征在于,根据以下公式,确定对抗学习损失函数Ladv(xs,xt):
其中,D表示领域判别器函数,xs表示源域图像,xt表示目标域图像,表示在源域图像xs上的期望、表示在目标域图像xt上的期望,表示针对源域图像xs的预测结果,表示针对目标域图像xt的预测结果。
5.根据权利要求1所述的跨域自适应语义分割方法,其特征在于,根据以下公式,确定所述目标域数据中各类别的平均熵
其中,C表示源域图像的类别;h,w表示像素位置,c表示该像素类别,xt表示目标域图像,表示在位置(h,w)处类别c的预测结果。
6.根据权利要求1所述的跨域自适应语义分割方法,其特征在于,所述筛选出平均熵最高的K个类别的目标域数据,采用软采样方法进行重采样,具体包括:
根据公式进行重采样,得到重采样数据pins(x);
其中,λ表示超参数,wi表示类别i的重采样权重,pi(x)表示样本x中类别i的采样概率,yi表示类比为i的标签值,si表示类别i的像素数。
7.根据权利要求1-6中任一项所述的跨域自适应语义分割方法,其特征在于,在进行迭代训练之前,还包括:
对训练数据集进行归一化处理,得到统一大小的训练数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110511242.7/1.html,转载请声明来源钻瓜专利网。