[发明专利]一种基于YOLOv3深度学习的混凝土裂缝识别方法在审
申请号: | 201910558541.9 | 申请日: | 2019-06-26 |
公开(公告)号: | CN110175658A | 公开(公告)日: | 2019-08-27 |
发明(设计)人: | 申永刚;俞臻威;张仪萍;温作林 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G01N21/88 |
代理公司: | 重庆市信立达专利代理事务所(普通合伙) 50230 | 代理人: | 包晓静 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多目标 候选框 混凝土结构 混凝土裂缝 图像训练集 像素分辨率 工程应用 聚类分析 裂缝识别 裂缝图像 逻辑回归 目标检测 评价标准 损伤检测 特征融合 网络训练 学习算法 原始图像 运算成本 自动压缩 边界框 标注框 鲁棒性 上采样 特征图 准确率 网格 裂缝 尺度 图像 概率 预测 学习 | ||
1.一种基于YOLOv3深度学习的混凝土裂缝识别方法,其特征在于,所述基于YOLOv3深度学习的混凝土裂缝识别方法采用YOLOv3中的Darknet-53网络作为特征提取器,将目标检测作为回归问题处理,基于一个单独的端到端神经网络模型直接进行目标区域定位及目标类别预测;
将裂缝图像导入YOLOv3,图像被自动压缩为416×416像素分辨率;采用类似FPN的上采样和特征融合方式,将原始图像按特征图的尺度大小划分为S×S网格;以候选框与真实框的交并比作为评价标准,对图像训练集的所有裂缝目标标注框使用K-means聚类分析,以获得候选框的大小;YOLOv3对每个边界框通过逻辑回归预测该框包含目标的概率。
2.如权利要求1所述的基于YOLOv3深度学习的混凝土裂缝识别方法,其特征在于,所述基于YOLOv3深度学习的混凝土裂缝识别方法具体包括:
第一步,获取宽度约为0.05mm或以上的裂缝目标图像;将图像裁剪成统一大小,对图像中的目标手动添加矩形标签作为真实边界框,形成数据库;
第二步,将目标图像导入YOLOv3,图像被自动压缩为416×416像素分辨率;采用类似FPN的上采样和特征融合方式,将原始图像按特征图的划分为S×S网格;
第三步,确定anchor个数和宽高,从裂缝标注目标框的数据中学习特征,找到统计规律,再利用K均值聚类算法对目标框作聚类分析,以K值作为anchor的个数;以候选框与真实框的交并比作为评价标准,对图像训练集的所有裂缝目标标注框使用K-means聚类分析,以获得候选框的大小;
第四步,对每一个网格使用3个anchorbox即先验框对目标边界进行预测,边界框信息为物体的中心位置相对于该点所在网格左上角的偏移量(tx,ty)及宽度tw和高度th;若目标中心在单元格中相对于图像左上角有偏移(cx,cy),并且候选框具有宽度pw和高度ph;
第五步,对目标进行类别预测,YOLOv3对每个边界框通过逻辑回归来预测该框包含目标的概率;如果预测的边界框与真实的边界框大面积重合且比其他预测的边界框重合率高,其概率为1;如果重合率没有达到YOLOv3阈值0.5或大于阈值,但不是最大者,该预测边界框会被忽略,不会对损失函数造成影响;
第六步,将预测得到的结果:高维特征向量、目标真实边界框及类别标签作为输入,设定学习率、学习率衰减速度、网络动量参数、权重衰减正则项、批次大小、批次大小划分和阈值,训练对目标的边界框及类别进行精细回归的回归器模型。
3.如权利要求2所述的基于YOLOv3深度学习的混凝土裂缝识别方法,其特征在于,所述第三步K-means聚类的距离函数为;
d(B,C)=1-RIOU(B,C);
式中B为矩形框的大小,C为矩形框的中心,RIOU(B,C)表示候选边界框与真实边界框的交并比。
4.如权利要求2所述的基于YOLOv3深度学习的混凝土裂缝识别方法,其特征在于,所述第四步的边界框信息为物体的中心位置相对于该点所在网格左上角的偏移量(tx,ty)及宽度tw和高度th;若目标中心在单元格中相对于图像左上角有偏移(cx,cy),并且候选框具有宽度pw和高度ph,则修正后的边界框为:
bx=σ(tx)+cx
by=σ(ty)+cy
5.如权利要求2所述的基于YOLOv3深度学习的混凝土裂缝识别方法,其特征在于,所述第五步对目标进行类别预测;每个预测任务得到的特征大小为:
S×S×[3×(4+l+B)];
式中S为网格大小,3为每个网格的先验框数量,4是边界框大小和坐标,1是置信度,B是类别数量。
6.一种应用权利要求1~5任意一项所述基于YOLOv3深度学习的混凝土裂缝识别方法的混凝土结构损伤检测控制系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910558541.9/1.html,转载请声明来源钻瓜专利网。