[发明专利]一种基尼指数引导的基于自训练的语义分割方法在审

申请号：	202110318561.6	申请日：	2021-03-25
公开（公告）号：	CN113095328A	公开（公告）日：	2021-07-09
发明（设计）人：	王立春;胡玉杰;王少帆;孔德慧;李敬华;尹宝才	申请（专利权）人：	北京工业大学
主分类号：	G06K9/34	分类号：	G06K9/34;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	沈波
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种指数引导基于训练语义分割方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基尼指数引导的基于自训练的语义分割方法，其特征在于：利用合成数据集作为源域，真实数据集为目标域；训练时，在域间自适应网络输入源域和目标域图像进行训练，训练完成后，将目标域图像进行划分输入到域内自适应网络进行训练，得到最优分割结果；

具体方法步骤如下：

步骤(1)，将源域数据集和目标域数据集随机各取一张RGB图像作为一个batch输入语义分割网络G_te；

步骤(2)，对源域图像，基于网络最后两层的输出预测图和groundtruth计算交叉熵损失，并将源域最后两层的损失进行加权求和；

步骤(3)，对目标域图像，最后两层的输出预测图分别计算基尼指数及不确定性损失，并将目标域最后两层的损失加权求和；

步骤(4)，将步骤(2)计算的加权损失和步骤(3)计算的加权损失进行求和，利用误差反向传播优化模型，迭代到模型的损失小于一定阈值后，这一batch数据训练结束；

步骤(5)，回步骤1继续选取新的batch数据，重复步骤1到步骤5直到完成2000个batch的训练并保存所训练的模型；

步骤(6)，重复步骤(1)至步骤(5)直到共训练120000个batch数据，即一共保存60个模型；

步骤(7)，将保存的60个模型在目标域验证集进行测试，利用准确率最好的模型计算目标域训练集图像的输出预测，计算输出预测对应的基尼指数并基于基尼指数对目标域训练集图像赋予伪标签；

步骤(8)，将源域数据集和目标域数据集随机各取一张RGB图像作为一个batch作为输入，训练语义分割网络G_st；

步骤(9)，对源域图像，基于最后两层的输出预测图和groundtruth计算交叉熵损失，并将源域最后两层的损失进行加权求和；

步骤(10)，对目标域图像，最后两层的输出预测图分别和伪标签计算交叉熵损失，并将目标域最后两层的损失进行加权求和；

步骤(11)，对目标域图像，最后两层的输出预测图分别计算基尼指数及不确定性损失，并将目标域最后两层的损失加权求和；

步骤(12)，将步骤(9)、步骤(10)和步骤(11)的加权损失进行求和，利用误差反向传播优化模型，迭代到模型的损失小于一定阈值后，这一batch数据训练结束；

步骤(14)，回步骤8继续选取新的batch数据，重复步骤8到12直到完成2000个batch的训练并保存所训练的模型，共训练120000个batch数据，即一共保存60个模型；

步骤(15)，测试时将所保存的60个模型在目标域测试集进行测试，获取最终分割结果。

2.根据权利要求1所述的一种基尼指数引导的基于自训练的语义分割方法，其特征在于：所搭建的模型为无监督领域自适应网络，网络整体结构包括两个子网络G_te和G_st；首先训练网络G_te；随后依据网络G_te对目标域预测的不确定性度量结果选取目标域图像的伪标签，给相应的目标域图像赋予伪标签后训练语义分割网络G_st，通过增加有效的监督信息提高对目标域图像的预测准确性。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110318561.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种免洗手消毒凝胶生产用混合装置及混合方法
下一篇：一种基于流化床干燥机用的警报保护装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基尼指数引导的基于自训练的语义分割方法在审

专利文献下载