[发明专利]一种检测地铁车侧巡检图像上工件的位置和类型的方法有效
申请号: | 202011417538.4 | 申请日: | 2020-12-07 |
公开(公告)号: | CN112418155B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 张朝龙;周治宇;周帆;王健;王贵东;朱均;梁海清;朱冬 | 申请(专利权)人: | 成都川哈工机器人及智能装备产业技术研究院有限公司;成都轨道交通产业技术研究院有限公司 |
主分类号: | G06V20/20 | 分类号: | G06V20/20;G06V10/40;G06V10/774;G06V10/82;G06N3/0464;G06N3/096 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 李朝虎 |
地址: | 610000 四川省成都市中国(四川)自由贸易试验区成都高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 地铁 巡检 图像 工件 位置 类型 方法 | ||
1.一种检测地铁车侧巡检图像上工件的位置和类型的方法,基于YOLOV4构建地铁构建地铁工件检测模型,其特征在于,包括以下步骤:
S1:采用CSPDarknet53网络预训练的权重,对YOLOv4的主干网络进行初始化操作,得到带有权重的卷积神经网络;
S2:提取带有工件标注数据的图像数据,将该图像数据作为带有权重的卷积神经网络的训练样本,把该训练样本的尺寸缩放为608x608,得到新的数据训练样本;
S3:将该新的数据训练样本划分为SxS个子图区域,得到SxS个单元网络,其中S为常数;
S4:得到SxS个单元网络后,对每一个单元网络区域使用CSPDarknet53提取视觉特征,得到视觉特征数据集;
S5:对每一个单元网络区域使用CSPDarknet53提取视觉特征的同时,引入空间金字塔池化SPP操作增强搜索视野,得到增强视野后视觉特征数据集;
S6:使用PANet的路径聚合模块对CSPDarknet53网络输出的增强视野视觉特征数据集进行处理,处理之后生成子图区域的预测目标数据;
S7:对于生成预测目标数据的子图区域,PANet输出得到每个子图区域的向量特征;
S8:使用yolo算法合并所有子图区域的向量特征,形成一个预测张量;
S9:将得到的预测张量输入卷积神经网络中,计算出卷积神经网络的梯度,对该卷积神经网络的梯度使用随机梯度下降法对代价函数进行最佳拟合后得到卷积神经网络输出的权重值;
S10:对卷积神经网络输出的权重值与标准的预设训练数据相比较后,反复迭代修正权重值,取得最终的权重值矩阵;将述权重值矩阵更新至卷积神经网络中,得到更新之后的卷积神经网络的权重。
2.根据权利要求1所述的一种检测地铁车侧巡检图像上工件的位置和类型的方法,其特性在于,所述获取图像数据并进行工件标注的方法为:使用工业相机扫描地铁列车两侧车身,获得原始扫描图片;把原始图片分割成1808×1808分辨率大小的子图;对上述分割后的图片进行工件位置和类型标注,标注完成后,导出json数据格式的标注文件并对标注文件进行清洗,保持所有工件目标的标注的数据基本一致,以防止由于数据分布不均衡导致训练模型时出现不平衡的情况。
3.根据权利要求2所述的一种检测地铁车侧巡检图像上工件的位置和类型的方法,其特性在于,使用Colabeler图片标注工具标注工件目标,包括:不同位置的螺丝、上刹车片、下刹车片和铁丝,其中,每一种螺丝作为一种独立的目标。
4.根据权利要求1所述的一种检测地铁车侧巡检图像上工件的位置和类型的方法,其特性在于,所述PANet对每一个子图区域都输出一个向量特征,包括:一个边界框boundingbox,其值为(x,y,w,h),其中(x,y)为边界框的中心左边,w和h分别为边界框的宽度和长度;Pr(object)*IoU,其中Pr(object)为存在目标的置信度,Pr(object)=0表示该区域为背景,Pr(object)=1则表示该框一定包含工件;以及对每个类别的预测条件概率:Pr(classi|object),其中classi代表第i个目标。
5.根据权利要求1所述的一种检测地铁车侧巡检图像上工件的位置和类型的方法,其特性在于,所述形成的预测张量的长度为S×S×(B×5+c),其中B=2,C为工件目标的种类数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都川哈工机器人及智能装备产业技术研究院有限公司;成都轨道交通产业技术研究院有限公司,未经成都川哈工机器人及智能装备产业技术研究院有限公司;成都轨道交通产业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011417538.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序