[发明专利]一种结合边界感知和语义分割的复杂场景检测方法在审
申请号: | 202210777680.2 | 申请日: | 2022-07-04 |
公开(公告)号: | CN115131321A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 陈丰农;丁云帅 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/25;G06V10/26;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 边界 感知 语义 分割 复杂 场景 检测 方法 | ||
1.一种结合边界感知和语义分割的复杂场景检测方法,其特征在于,包括如下步骤:
S1、创建图像的数据集;
S2、对数据集中的图像数据进行预处理;
S3、构建检测网络,所述检测网络采用双流式结构,由pytorch框架搭建深度神经网络结构,所述检测网络包括编码器网络、解码器网络和边界感知网络,
编码器网络用于对特征进行提取,编码器网络采用预训练的ResNet-18网络,可以快速对特征信息进行下采样,以获得大的感受野,采用4个卷积块对图像进行下采样,每次下采样得到不同尺度的特征图,
边界感知网络用于关注水域边界,丢弃大量冗余信息,边界感知网络通过边界卷积,来促进语义信息转换到边界信息,
解码器网络将不同尺寸的特征与边界信息融合,提出的基于全局平均池和最大池操作,并将其细化为最后分割结果;
S4、训练检测网络得到最优的收敛模型
S4-1、设计双损失函数
所述双损失函数中语义损失采用标准交叉熵,边界损失采用二元交叉熵和骰子损失联合优化边界学习,表达式如下:
Lboundary(pd,gd)=λ1Ldice(pd,gd)+λ1Lbce(pd,gd)
其中,Lboundary表示边界损失,H和W分别表示数据集中图像的长和宽,Lbce表示二元交叉熵损失,Ldice表示骰子损失,pd∈RH×W表示预测边界图,gd∈RH×W表示从标记的分割掩码中得到的真实边界图,其中i表示第i个像素,λ1、λ2、c为超参数;
S4-2、确定超参数,采用Adam优化器对检测网络进行训练,使检测网络损失最小,即最优收敛模型;
S5、加载训练得到的最优收敛模型,将待预测图像输入最优收敛模型中进行预测得到分割图;
S6、对分割图进行后处理得到最终的水岸线。
2.根据权利要求1所述的结合边界感知和语义分割的复杂场景检测方法,其特征在于,所述步骤S1中创建的数据集采用USVInland数据集作为水岸线检测数据集。
3.根据权利要求1所述的结合边界感知和语义分割的复杂场景检测方法,其特征在于,所述图像数据预处理的方法为:通过数据增强的方法提高图像的数量和多样性,所述数据增强方法包括裁剪、镜像、亮度和对比度调节。
4.根据权利要求1所述的结合边界感知和语义分割的复杂场景检测方法,其特征在于,所述步骤S3中搭建的网络包括编码器网络、边界感知网络和解码器网络,所述编码器网络包括4个依次连接的卷积层和1个池化层,所述边界感知网络包括2个边界卷积块,所述解码器网络包括注意力细化模块、特征融合模块和上采样,所述编码器网络中第一和第三个卷积层分别插入两个边界卷积块生成边界特征图,所述注意力细化模块分别与池化层和第四个卷积层相连接获取语义信息,所述特征融合模块读取边界特征图和语义信息进行融合,并通过上采样输出分割图。
5.根据权利要求1所述的结合边界感知和语义分割的复杂场景检测方法,其特征在于,所述编码器网络尾部增大感受野所使用的池化层采用全局平均池。
6.根据权利要求1所述的结合边界感知和语义分割的复杂场景检测方法,其特征在于,所述步骤S6中后处理方法为通过边缘检测算法提取分割图中的水岸线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210777680.2/1.html,转载请声明来源钻瓜专利网。