[发明专利]一种基于双网络协同分割模型的图像语义分割方法在审
申请号: | 202310309481.3 | 申请日: | 2023-03-28 |
公开(公告)号: | CN116468888A | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 舒禹程;兰尹;肖斌;李伟生 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/774;G06V10/764 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 周磊 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 协同 分割 模型 图像 语义 方法 | ||
1.一种基于双网络协同分割模型的图像语义分割方法,其特征在于,包括:
构建双网络协同分割模型并进行训练,将待分割的图像输入训练好的双网络协同分割模型,得到分割结果;
所述双网络协同分割模型,包括:两个参数不同网络结构相同的分割网络fθ1和fθ2,所述fθ1和fθ2包括:编码器、分类器、和投影头;
所述双网络协同分割模型的训练过程,包括以下步骤:
S1:将有标签数据输入分割网络fθ1和fθ2,采用传统的基于像素级交叉熵的全监督语义分割方法进行模型的训练,训练的全监督损失函数用表示;
S2:对无标签数据xu进行弱数据增强Aw处理,得到无标签数据的弱数据增强版本xw=Aw(xu);
S3:将弱数据增强版本xw进行两次强数据增强As处理,得到两个不同的强数据增强版本xs1=As(xw)和xs2=As(xw);
S4:将弱数据增强版本xw同时输入分割网络fθ1和fθ2,先对xw通过编码器进行编码,然后使用分类器进行分类,分别得到分割预测和
S5:将两个强数据增强版本xs1、xs2分别输入分割网络fθ1和fθ2,两个网络分别对xs1、xs2通过编码器进行编码,然后使用分类器进行分类,分别得到分割预测和
S6:将弱数据增强版本的预测分别进行硬化操作,得到伪标签y1和y2;
S7:根据伪标签y1和y2使用损失函数进行跨网络在标签空间中的一致性学习;
S8:将无标签数据的弱数据增强版本xw输入分割网络fθ1和fθ2,分别通过两个分割网络的编码器对xw进行编码,通过投影头将编码后的xw投影到对比学习特征空间中,得到特征集合z1、z2;
S9:将特征集合z1、z2中来自不同网络被投射到同一特征空间的具有相同位置的特征定义为一对正样本,将具有不同伪标签的特征定义为一对负样本;
S10:通过正负样本对得到模型跨网络对比学习在特征空间中的损失函数通过优化进行对比学习让锚特征向量与正样本相互吸引,与负样本相互排斥;
S11:根据全监督训练和半监督训练的损失函数得到所述双网络协同分割模型的整体损失函数,当整体损失函数的损失值最小时,完成所述双网络协同分割模型的训练,得到训练好的双网络协同分割模型。
2.根据权利要求1所述的一种基于双网络协同分割模型的图像语义分割方法,其特征在于,所述有标签数据进行全监督训练的损失函数包括:
其中,lce()表示交叉熵损失函数,xl表示标签数据,y表示xl对应的标签,W和H分别为待分割图像xl的宽和高,fθ表示模型的分割网络,T表示转置操作,yi表示索引为i的标签,表示索引为i的标签数据。
3.根据权利要求1所述的一种基于双网络协同分割模型的图像语义分割方法,其特征在于,所述强弱数据增强,包括:
所述弱数据增强方法包括:随机裁剪、随机水平翻转以及随机缩放;
所述强数据增强方法包括:随机高斯模糊、随机颜色失真以及随机灰度缩放。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310309481.3/1.html,转载请声明来源钻瓜专利网。