[发明专利]基于改进Faster-RCNN的大坝裂缝检测模型及方法有效
申请号: | 202010595456.2 | 申请日: | 2020-06-28 |
公开(公告)号: | CN113408327B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 韩旭;许国艳;苏心玥;王健 | 申请(专利权)人: | 河海大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/764;G06V10/80;G06V10/82;G06N3/04;G06N3/08;G06T3/40;G06T7/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 faster rcnn 大坝 裂缝 检测 模型 方法 | ||
1.一种基于改进Faster-RCNN的大坝裂缝检测模型进行大坝裂缝检测的方法,其特征在于,包括:
根据基于改进Faster-RCNN的大坝裂缝检测模型结构构建预训练模型;
对采集的大坝裂缝相关的样本图像进行预处理,获得样本数据集;
利用所述样本数据集,基于训练算法对所述预训练模型进行反向传播迭代训练,得到训练好的模型;
利用训练好的模型对大坝裂缝进行检测;
其中,所述基于改进Faster-RCNN的大坝裂缝检测模型包括:
特征提取模块,其被配置为利用卷积神经网络对输入图像的特征进行逐层提取,得到每层的特征图;
区域生成模块,其被配置为利用区域生成网络,基于特征提取网络最后一层输出的特征图进行映射,得到锚框;其中,区域生成模块,用于利用区域生成网络RPN,基于特征提取网络最后一层输出的特征图,结合Anchor和Stride进行映射,得到锚框,即Anchor box;根据检测需求设定Anchor数量以及ANCHOR_RATIOS和ANCHOR_SIZES;对最后一层输出的特征图采用滑窗方式遍历,每个特征像素点对应K个Anchor,利用Anchor Boxes将待检测物体框选出;
反馈映射模块,用于Anchor box映射至特征提取模块提取的后三层特征图,即conv3_x,conv4_x,conv5_x输出的特征图,得到对应的映射特征图;
多尺度特征融合模块,用于将映射特征图的特征进行融合,得到融合特征图;具体地,多尺度特征融合模块包括感兴趣区域池化单元、拼接单元、归一化单元和缩放单元;感兴趣区域池化单元对每个映射进行感兴趣区域池化操作,用于将每个映射特征图调整至相同分辨率;拼接单元用于将感兴趣区域池化后的分辨率相同的三层特征图进行拼接;归一化单元用于将拼接后的特征图在channel轴进行归一化处理,能够在一定程度上解决因为不同层输出的特征数量不同而导致的学习过程不收敛的状况,归一化公式为:
其中,I(c|x|y)2是归一化之前的特征图,In(c|x|y)是归一化之后的特征图,c则代表对应特征图的特征,即归一化之前和归一化之后的特征图分别对应的宽和高;
反馈映射模块,其被配置为将锚框映射至特征提取模块提取的后三层特征图,得到对应的映射特征图;
多尺度特征融合模块,其被配置为将所述映射特征图的特征进行融合,得到融合特征图;
分类回归模块,其被配置为根据所述融合特征图进行分类和回归,得到检测结果。
2.根据权利要求1所述的方法,其特征在于,所述特征提取模块中的卷积神经网络采用ResNet101网络。
3.根据权利要求1所述的方法,其特征在于,所述特征融合模块包括:
感兴趣区域池化单元,其被配置为对每个所述映射特征图进行感兴趣区域池化操作,用于将每个所述映射特征图调整至相同分辨率;
拼接单元,用于将感兴趣区域池化后的特征图进行拼接。
4.根据权利要求3所述的方法,其特征在于,所述特征融合模块还包括:
归一化单元,其被配置为将拼接后的特征图在channel轴进行归一化处理;
缩放单元,其被配置为将归一化的特征图扩大后经1*1的卷积核处理,得到所述融合特征图。
5.根据权利要求4所述的方法,其特征在于,所述归一化处理,具体通过以下公式进行:
其中,I(c|x|y)2是归一化之前的特征图,In(c|x|y)是归一化之后的特征图,c则代表对应特征图的特征。
6.根据权利要求1所述的方法,其特征在于,所述样本图像的类别包括:渗水裂缝、非渗水裂缝、缝隙内含植被的、无裂缝、背景。
7.根据权利要求1所述的方法,其特征在于,所述预处理包括:
通过平移、剪裁、旋转对样本图像进行扩增;
使用目标检测标注工具对样本图像中裂缝所在的位置及对应的分类进行标注,并统一样本图像格式。
8.根据权利要求1所述的方法,其特征在于,损失函数包括分类损失函数和回归损失函数,具体表示为:
其中,为分类损失,i为整数,pi表示第i个锚框预测为目标的概率;为样本标签的概率;是两个类别的对数损失:
为回归损失,ti是一个向量,表示区域生成网络训练阶段预测的偏移量;是与ti相同维度的向量,表示区域生成网络训练阶段预测的锚框相对于目标所在的真实框gt的偏移量:
R表示Smooh L1函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010595456.2/1.html,转载请声明来源钻瓜专利网。