[发明专利]一种联合反射注意力和自注意力机制的道路水体检测方法有效

申请号：	202011290844.6	申请日：	2020-11-17
公开（公告）号：	CN112699727B	公开（公告）日：	2022-10-28
发明（设计）人：	王欢;孟策	申请（专利权）人：	南京理工大学
主分类号：	G06V20/10	分类号：	G06V20/10;G06V10/82;G06N3/04;G06N3/08
代理公司：	南京理工大学专利中心 32203	代理人：	岑丹
地址：	210094 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种联合反射注意力机制道路水体检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种联合反射注意力和自注意力机制的道路水体检测方法，其特征在于，包括以下步骤：

步骤1、利用可见光相机采集不同场景下的道路图像并缩放至指定尺寸构成训练集，标注训练集图像的水体位置信息的掩膜作为标签；

步骤2、构建联合反射注意力单元和自我注意力机制的类U-Net网络，所述类U-Net网络包括下采样通道、位置注意力模块和通道注意力模块、上采样通道；

所述位置注意力模块用于对特征图conv5a做处理，得到输出特征图sa，处理过程具体为：

a)通过3个不同的1×1卷积核对输入特征图conv5a进行降维，得到三个不同的特征图conv5a_query、conv5a_key、conv5a_value；

b)分别对特征图conv5a_query和conv5a_key进行转置，得到conv5a_query'、conv5a_key'，执行矩阵相乘，经过softmax层后得到w个h×h的矩阵，记为S₁；

c)对特征图conv5a_value进行转置，与S₁执行矩阵乘法，并且用1×1卷积核进行卷积得到特征图H₁；

d)输出的特征图为sa＝conv5a+αH₁，其中α初始值为0；

所述位置注意力模块用于对特征图conv5c做处理，得到输出特征图sc，处理过程具体为：

a)对于输入特征图conv5c，将其重组为[h×w,c]的特征图conv5c'；

b)将特征图conv5c'转置得到特征图conv5c”；

c)对conv5c'和conv5c”执行矩阵乘法，得到注意力矩阵S₂，对注意力矩阵S₂进行归一化以及softmax操作；

d)将输入特征图conv5c与矩阵S₂相乘，得到特征图H₂；

e)输出的特征图sc＝conv5c+αH₂，其中α初始值为0，由学习得到；

步骤3、利用训练集图像训练类U-Net网络；

步骤4、将待检测的可见光图像馈送到网络中，获得用以表示水体区域和非水体区域的二值图像。

2.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法，其特征在于，标注训练集图像的水体位置信息的掩膜作为标签的具体过程为：

标注训练集图像中的水体区域信息，得到相应的二值掩膜；

原掩膜像素值大于127的像素点，将其值赋为0，否则为1，记为mask1，并将原掩膜像素值大于127的像素点，将其值赋为1，否则为0，记为mask2；将mask1和mask2在通道维度上相连，作为训练标签。

3.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法，其特征在于，所述下采样通道包括依次间隔连接的5个下采样卷积块和5个RAU，且前4个RAU之后均进行均值池化操作。

4.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法，其特征在于，所述下采样通道的输出特征通过两个不同的卷积核大小为3×3，步长为1×1的卷积操作，得到通道数为512维的特征图conv5a和conv5c。

5.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法，其特征在于，所述上采样通道包括4个依次连接的上采样块和一个1×1的卷积块，所述上采样块对输入特征图通过一个卷积核大小为2×2，步长为2×2的转置卷积，将其长、宽扩大一倍；通过ReLU激活函数得到激活值，并与特征图O₄在通道维度上相连，再通过两个卷积核大小为3×3，步长为1×1的卷积操作，得到通道维度为输入特征图一半的输出特征图。

6.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法，其特征在于，类U-Net网络的损失函数采用的是交叉熵损失函数，具体为：

其中，x_i代表网络的第i个输入，p(x_i)代表其真实的标签值，q(x_i)代表其预测的标签值。

7.根据权利要求1所述的联合反射注意力和自注意力机制的道路水体检测方法，其特征在于，利用训练集图像训练类U-Net网络的具体过程为：

随机初始化构造的类U-Net网络中的参数，使用Adam优化器优化网络，将其学习率设置为0.0002，系数beta1设置为0.5，迭代轮次的目标次数设为100000次/训练集图像数量，每遍历完训练集中的图像一次，迭代轮次数加1。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京理工大学，未经南京理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011290844.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于CKF的主从式多水下无人潜器协同定位方法
下一篇：一种3-氨基-1-金刚烷醇及其合成方法

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种联合反射注意力和自注意力机制的道路水体检测方法有效

专利文献下载