[发明专利]一种联合反射注意力和自注意力机制的道路水体检测方法有效
申请号: | 202011290844.6 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112699727B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 王欢;孟策 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 岑丹 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联合 反射 注意力 机制 道路 水体 检测 方法 | ||
1.一种联合反射注意力和自注意力机制的道路水体检测方法,其特征在于,包括以下步骤:
步骤1、利用可见光相机采集不同场景下的道路图像并缩放至指定尺寸构成训练集,标注训练集图像的水体位置信息的掩膜作为标签;
步骤2、构建联合反射注意力单元和自我注意力机制的类U-Net网络,所述类U-Net网络包括下采样通道、位置注意力模块和通道注意力模块、上采样通道;
所述位置注意力模块用于对特征图conv5a做处理,得到输出特征图sa,处理过程具体为:
a)通过3个不同的1×1卷积核对输入特征图conv5a进行降维,得到三个不同的特征图conv5a_query、conv5a_key、conv5a_value;
b)分别对特征图conv5a_query和conv5a_key进行转置,得到conv5a_query'、conv5a_key',执行矩阵相乘,经过softmax层后得到w个h×h的矩阵,记为S1;
c)对特征图conv5a_value进行转置,与S1执行矩阵乘法,并且用1×1卷积核进行卷积得到特征图H1;
d)输出的特征图为sa=conv5a+αH1,其中α初始值为0;
所述位置注意力模块用于对特征图conv5c做处理,得到输出特征图sc,处理过程具体为:
a)对于输入特征图conv5c,将其重组为[h×w,c]的特征图conv5c';
b)将特征图conv5c'转置得到特征图conv5c”;
c)对conv5c'和conv5c”执行矩阵乘法,得到注意力矩阵S2,对注意力矩阵S2进行归一化以及softmax操作;
d)将输入特征图conv5c与矩阵S2相乘,得到特征图H2;
e)输出的特征图sc=conv5c+αH2,其中α初始值为0,由学习得到;
步骤3、利用训练集图像训练类U-Net网络;
步骤4、将待检测的可见光图像馈送到网络中,获得用以表示水体区域和非水体区域的二值图像。
2.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法,其特征在于,标注训练集图像的水体位置信息的掩膜作为标签的具体过程为:
标注训练集图像中的水体区域信息,得到相应的二值掩膜;
原掩膜像素值大于127的像素点,将其值赋为0,否则为1,记为mask1,并将原掩膜像素值大于127的像素点,将其值赋为1,否则为0,记为mask2;将mask1和mask2在通道维度上相连,作为训练标签。
3.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法,其特征在于,所述下采样通道包括依次间隔连接的5个下采样卷积块和5个RAU,且前4个RAU之后均进行均值池化操作。
4.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法,其特征在于,所述下采样通道的输出特征通过两个不同的卷积核大小为3×3,步长为1×1的卷积操作,得到通道数为512维的特征图conv5a和conv5c。
5.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法,其特征在于,所述上采样通道包括4个依次连接的上采样块和一个1×1的卷积块,所述上采样块对输入特征图通过一个卷积核大小为2×2,步长为2×2的转置卷积,将其长、宽扩大一倍;通过ReLU激活函数得到激活值,并与特征图O4在通道维度上相连,再通过两个卷积核大小为3×3,步长为1×1的卷积操作,得到通道维度为输入特征图一半的输出特征图。
6.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法,其特征在于,类U-Net网络的损失函数采用的是交叉熵损失函数,具体为:
其中,xi代表网络的第i个输入,p(xi)代表其真实的标签值,q(xi)代表其预测的标签值。
7.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法,其特征在于,利用训练集图像训练类U-Net网络的具体过程为:
随机初始化构造的类U-Net网络中的参数,使用Adam优化器优化网络,将其学习率设置为0.0002,系数beta1设置为0.5,迭代轮次的目标次数设为100000次/训练集图像数量,每遍历完训练集中的图像一次,迭代轮次数加1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011290844.6/1.html,转载请声明来源钻瓜专利网。