[发明专利]一种用于交通道路场景的图像语义分割模型训练方法在审
申请号: | 202210103540.7 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114419058A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 张帆;曹松;任必为;宋君;陶海 | 申请(专利权)人: | 北京文安智能技术股份有限公司 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06N3/04;G06N3/08;G06T5/50 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100094 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 交通 道路 场景 图像 语义 分割 模型 训练 方法 | ||
1.一种用于交通道路场景的图像语义分割模型训练方法,其特征在于,包括:
步骤S1,构造基础网络为DeepLabV3plus网络和ResnetX网络组合的语义分割基础模型,其中,所述DeepLabV3plus网络的上采样算子使用最邻近插值模式计算;
步骤S2,调整所述基础网络的结构以形成语义分割初始模型,其中,调整过程为:复制所述DeepLabV3plus网络的卷积模块至所述DeepLabV3plus网络的底部作为底层卷积模块,将所述基础网络的输入端通过卷积层组后通过跳跃连接的方式与所述DeepLabV3plus网络的输出端合并,将合并端作为所述底层卷积模块的输入端,所述底层卷积模块的输出为最终语义分割结果;
步骤S3,利用交通道路场景的样本图像训练集训练所述语义分割初始模型,以获得图像语义分割模型。
2.根据权利要求1所述的图像语义分割模型训练方法,其特征在于,所述卷积层组包括一层或多层所述卷积层,各所述卷积层的卷积核尺寸为3×3,卷积步长为1,填充值为0或1。
3.根据权利要求2所述的图像语义分割模型训练方法,其特征在于,所述卷积层组包括多层所述卷积层,多层卷积层的数量大于1层且小于等于3层。
4.根据权利要求2所述的图像语义分割模型训练方法,其特征在于, 所述填充值包括填充宽度值和填充高度值。
5.根据权利要求1所述的图像语义分割模型训练方法,其特征在于,所述DeepLabV3plus网络的卷积模块和所述底层卷积模块的结构自上而下包括:卷积层、BN层、Relu层和卷积层。
6.根据权利要求1所述的图像语义分割模型训练方法,其特征在于,所述样本图像训练集包括第一训练集和第二训练集,所述第一训练集中的训练图像选自奥迪大型自动驾驶数据集A2D2中的前部车载取像设备沿道路方向的拍摄的正视交通道路场景图像和后部车载取像设备沿道路方向的拍摄的正视交通道路场景图像;所述第二训练集中的训练图像为高速道路场景图像。
7.根据权利要求6所述的图像语义分割模型训练方法,其特征在于,所述步骤S3包括:
步骤S31,使用所述第一训练集预训练所述语义分割初始模型,以获得语义分割预训练模型;
步骤S32,调整模型训练的学习率,使用所述第二训练集继续训练所述语义分割预训练模型,以获得所述图像语义分割模型。
8.根据权利要求7所述的图像语义分割模型训练方法,其特征在于,在所述步骤S32中,调整训练所述语义分割预训练模型时的学习率与训练所述语义分割初始模型时的学习率的比值在[1/5,1/2]之间。
9.根据权利要求6所述的图像语义分割模型训练方法,其特征在于,所述第二训练集中的训练图像的数量与所述第一训练集中的训练图像的数量的比值范围为[1/10,1]。
10.根据权利要求1所述的图像语义分割模型训练方法,其特征在于,所述基础网络中的ResnetX网络为Resnet18网络、Resnet34网络、Resnet50网络、Resnet101网络和Resnet152网络中的一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京文安智能技术股份有限公司,未经北京文安智能技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210103540.7/1.html,转载请声明来源钻瓜专利网。