[发明专利]一种基于基尼指数的领域自适应语义分割方法在审
申请号: | 202010781502.8 | 申请日: | 2020-08-06 |
公开(公告)号: | CN112116593A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 王立春;胡玉杰;王少帆;孔德慧;李敬华;尹宝才 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 指数 领域 自适应 语义 分割 方法 | ||
1.一种基于基尼指数的领域自适应语义分割方法,其特征在于:利用基尼指数度量输出预测的不确定性,在输出层对目标域输出预测进行不确定性度量及约束,减小源域和目标域在类别分布上的差异,进行域间自适应;依据基尼指数对目标域预测的不确定性度量结果将目标域样本集划分为两个子集,对域内高置信度预测对应的样本利用伪标签作为弱监督信息训练域内自适应分割网络,对域内自适应分割网络两个子集的输出预测计算基尼指数图,对低置信度样本计算的基尼指数图进行约束,并利用判别器Dt判别基尼指数图属于哪个子集,基于对抗思想减小目标域域内的差异,提高语义标注精度。
2.根据权利要求1所述的一种基于基尼指数的领域自适应语义分割方法,其特征在于:利用合成数据集作为源域,真实数据集为目标域;训练时,在域间自适应网络输入源域和目标域图像进行训练,训练完成后,将目标域图像进行划分输入到域内自适应网络进行训练,得到最优分割结果;
具体方法步骤如下:
步骤(1),将源域数据集和目标域数据集各取一张RGB图片(batchsize为2)同时输入域间自适应语义分割网络Gst;
步骤(2),利用域间自适应语义分割网络Gst得到源域和目标域的最后两层的输出预测分割图;
步骤(3),将源域最后两层的输出预测图分别和源域图片的groundtruth计算交叉熵损失,并将源域最后两层的损失进行加权求和;
步骤(4),将目标域最后两层的输出预测图分别利用基尼指数计算不确定性损失,并将目标域最后两层的损失加权求和;
步骤(5),将步骤(3)得出的源域最后两层的损失加权求和值和步骤(4)的目标域最后两层的损失加权求和值进行求和,为了训练最优化模型,我们的目标是利用误差反向传播使得损失最小化,得到最优结果;
步骤(6),依据训练好的域间自适应语义分割网络Gst的基尼指数结果对目标域数据集划分为高置信度数据集和低置信度数据集;
步骤(7),将划分后的目标域数据集作为域内自适应网络的输入数据集,每次输入一张RGB图片,利用域内自适应语义分割网络Gt分别得到高置信度数据集和低置信度数据集的最后两层的输出预测分割图;
步骤(8),将高置信度数据集最后两层的输出预测图分别和利用域间自适应分割网络Gst得到的高置信度数据集的伪标签计算交叉熵损失,并将两层的损失进行加权求和;
步骤(9)对域内自适应语义分割网络Gt得到高置信度数据集和低置信度数据集的最后两层的输出预测分割图计算基尼指数图,分别得到高置信度图像两层加权求和后的基尼指数图和低置信度图像两层加权求和后的基尼指数图;
步骤(10)将低置信度最后两层的加权求和的基尼指数图计算不确定性损失;
步骤(11)将高置信度图像两层加权求和后的基尼指数图和低置信度图像两层加权求和后的基尼指数图输入到判别器,分别贴上域标签1和0,与域内语义分割网络对抗,计算对抗损失;
步骤(12),将步骤(8)、步骤(10)、步骤(11)的损失加和,为了训练最优化模型,我们的目标是利用误差反向传播使得损失最小化,得到最优结果。
3.根据权利要求2所述的一种基于基尼指数的领域自适应语义分割方法,其特征在于:测试时,利用真实数据集即目标域作为输入,在域间自适应网络和域内自适应网络得到测试结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010781502.8/1.html,转载请声明来源钻瓜专利网。