[发明专利]语义分割网络的训练方法、图像处理方法及其设备在审
申请号: | 202110309167.6 | 申请日: | 2021-03-23 |
公开(公告)号: | CN113113119A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 贾富仓;陈宏宇 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G16H30/40 | 分类号: | G16H30/40;G06K9/34;G06K9/62;G06N3/08 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 黎坚怡 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 分割 网络 训练 方法 图像 处理 及其 设备 | ||
1.一种语义分割网络的训练方法,其特征在于,所述语义分割网络包括编码网络和解码网络,所述解码网络包括主解码网络和辅解码网络,其中,所述辅解码网络包括扰动设置和解码器,所述训练方法包括:
将训练图像集输入所述编码网络,所述训练图像集包括多张训练图像,得到所述训练图像的中间表示;
将所述中间表示输入所述主解码网络,得到所述训练图像的第一标签数据;
将所述中间表示输入所述扰动设置和所述解码器,得到所述训练图像的第二标签数据;
利用所述训练图像的所述第一标签数据和所述第二标签数据获取第一损失函数,并基于所述第一损失函数对所述语义分割网络进行训练。
2.根据权利要求1所述的训练方法,其特征在于,所述扰动设置连接所述编码网络以及所述辅解码网络中的解码器;
所述将所述中间表示输入所述扰动设置和所述解码器,得到所述训练图像的第二标签数据,包括:
将所述中间表示输入所述扰动设置,生成所述中间表示的扰动版本,
将所述扰动版本输入所述解码器,得到所述训练图像的第二标签数据。
3.根据权利要求1所述的训练方法,其特征在于,所述利用所述训练图像的所述第一标签数据和所述第二标签数据获取第一损失函数,包括:
利用均方差损失函数计算所述训练图像的所述第一标签数据和所述第二标签数据之间的误差;
计算所有所述训练图像的所述第一标签数据和所述第二标签数据之间的误差的平均数,作为所述第一损失函数。
4.根据权利要求3所述的训练方法,其特征在于,所述辅解码网络的数量为多个,每个所述辅解码网络包括一个对应的扰动设置;
所述利用均方差损失函数计算所述训练图像的所述第一标签数据和所述第二标签数据之间的误差,包括:
获取每个所述辅解码网络输出的所述训练图像的第二标签数据;
利用均方差损失函数计算所述训练图像的所述第一标签数据与每个所述辅解码网络对应的第二标签数据之间的误差;
计算所述训练图像的所述第一标签数据与所有所述辅解码网络对应的所述第二标签数据之间的误差的平均数,作为所述训练图像的所述第一标签数据和所述第二标签数据之间的误差。
5.根据权利要求4所述的训练方法,其特征在于,所述扰动设置包括F-Noise、F-Drop、Guided Masking、Intermediate VAT以及SpatialDropout中的任意一种或几种。
6.根据权利要求1所述的训练方法,其特征在于,所述训练图像集包括第一图像和带有第三标签数据的第二图像;
所述将训练图像集输入所述编码网络之前,包括:
利用所述第二图像训练所述语义分割网络;
所述基于所述第一损失函数对所述语义分割网络进行训练,包括:
利用所述第二图像的所述第一标签数据和所述第三标签数据获取第二损失函数;
利用所述第二损失函数和所述第一损失函数构成第三损失函数;
以减小所述第三损失函数为目的,对所述语义分割网络进行训练。
7.根据权利要求6所述的训练方法,其特征在于,所述利用所述第二图像的所述第一标签数据和所述第三标签数据获取第二损失函数,包括:
利用交叉熵损失函数计算所述第二图像的所述第一标签数据和所述第三标签数据之间的误差;
计算所有所述第二图像的所述第一标签数据和所述第三标签数据之间的误差的平均数,作为所述第二损失函数。
8.根据权利要求1所述的训练方法,其特征在于,所述将训练图像集输入所述编码网络之前,包括:
利用泊松图像编辑算法对所述训练图像集进行预处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110309167.6/1.html,转载请声明来源钻瓜专利网。