[发明专利]一种基于图像增强处理的接触网斜拉线故障自动检测方法在审
申请号: | 202110142118.8 | 申请日: | 2021-02-02 |
公开(公告)号: | CN112801989A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 刘志刚;李昱阳 | 申请(专利权)人: | 西南交通大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
代理公司: | 成都信博专利代理有限责任公司 51200 | 代理人: | 卓仲阳 |
地址: | 610031 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 增强 处理 接触 拉线 故障 自动检测 方法 | ||
1.一种基于图像增强处理的接触网斜拉线故障自动检测方法,其特征在于,包括以下步骤:
步骤1:对高速铁路接触网支撑及悬挂装置进行图像采集;
步骤2:根据采集到的接触网图像建立斜拉线的两个样本数据集,一个为包含正常亮度接触网图像的数据集,其用于训练DAL定位网络,一个为包含正常亮度和低亮度的接触网图像数据集,其用于训练图像增强网络3DLUT,两个数据集都被划分为训练集和测试集;
步骤3:采用完成训练的图像增强网络3DLUT对采集到的亮度较暗的包含斜拉线的接触网图像进行图像增强;
步骤4:采用完成训练的基于角度的DAL网络实现对斜拉线的斜定位;
步骤5:斜拉线松弛故障的检测:
S51:基于Hough变换的斜拉线角度峰值检测;
S52:基于正态样品和故障样品的峰值分布分析的斜拉线松弛判断。
2.根据权利要求1所述的一种基于图像增强处理的接触网斜拉线故障自动检测方法,其特征在于,所述步骤3具体为:
S31:在3DLUT网络当中,同时学习N个3DLUTs和一个的CNN模型;对于输入图像,最终增强后的输出描述如下:
优化后的目标函数定义如下:
其中wnn=1,...,N=f(x)表示CNN模型预测的内容自适应权重,f、φn表示CNN模型和3DLUT,L(q,y)表示损失函数和规则项,y为目标;
用配对数据或未配对数据进行训练;
配对数据训练的损失函数为均方误差损失函数,定义如下:
未配对数据的损失函数是指GAN对未配对数据进行训练,上述3DLUT和CNN看作是生成器,由G表示,此外还有一个鉴别器E,鉴别器E与生成器G的区别在于其去掉了实例归一化层和dropout层,而且FC层的输出维数设置为1;此时,生成器通过以下损失进行训练:
其中-D(G(x))用以增强生成器G实现对鉴别器的欺骗,[||G(x)-x||2]用以保证输入与输出内容保持相同的维度,而λ1=1000作为平衡参数存在;
鉴别器的损失函数定义如下:
式中λ2=10,前两项为标准判别损失,后一项为稳定训练的梯度惩罚项,其中是由生成器分布和目标分布中的一对点进行线性插值产生的一个例子;因此,总损失函数定义为:
Lgan=LG+LD (6)
为了稳定的将输入RGB变换到期望的颜色空间,而不引入伪影,使3DLUT的输出RGB具有局部平滑性,3DLUT将全变差TV引入其中,此时TV正则定义如下:
其中{r,g,b}为RGB颜色,i,j,k为其通道值,表示三次插值的结果;
除了3DLUT的平滑性,还引入了正则化来提高得到的3DLUT的平滑度;整体光滑正则项描述如下:
除了平滑,单调也是符合3DLUT的一个属性;单调正则项为:
其中g(.)表示标准的ReLU操作;
最后的训练损失及具体实现如下:
Lpaired=Lmse+λsRs+λmRm (10)
Lunpaired=Lgan+λsRs+λmRm (11)
其中λs和λm两个常数参数分别控制光滑项和单调正则化项的效果,并且λs=0.0001,λm=10;
S32:采用图像增强幅度来对接触网图像的增强效果进行评估,以增强后的图像imge与原始图像imgo的差值作为变量imglight,评价整个图像的增强程度;
imglight=imge-imgo (12)
计算图像的差值来反映接触网图像区域的图像增强程度。
3.根据权利要求1所述的一种基于图像增强处理的接触网斜拉线故障自动检测方法,其特征在于,所述步骤4具体为:
S41:基于RetinaNet的旋转检测:
DAL采用了ResNet-50作为骨干网络,其在P3到P7的每一层的特征上均预设了水平anchor;多方向框用(x,y,ω,h,θ)表示,对于包围框回归的公式如(13)所示:
x,y,ω,h,θ分别代表预测box的中心点坐标、宽度、高度以及角度,xa,yb,ωa,ha,θa则是anchor的参数;考虑到ground-truth box的偏移量定义多任务损失为:
L=Lcls(p,p*)+Lreg(t,t*) (14)
p为预测分类分数,t表示预测box偏移量,p*为anchors的类别标签:p*=1为正样本,p*=0为负样本;
S42:动态anchor选择
为了获取目标识别所需要的特征,DAL引入匹配度的概念,采用空间匹配的先验信息,特征对齐能力,anchor的回归不确定度来衡量定位能力,定义为公式(15):
md=α*sa+(1-α)*fa-uγ (15)
其中sa表示空间对齐的先验信息,值与输入IoU相等;fa是ground-truth框与回归框的IoU,表征特征对齐能力;α和γ是超参数,衡量影响度;u是惩罚因子,表示训练过程的不确定度,u是通过回归前后的IoU变化计算得到的,如公式(16)所示:
u=|sa-fa| (16)
在训练阶段时,首先计算anchor与Ground-Truth之间的匹配度,匹配度高于一个固定阈值的anchor选择为正样本,其余为负样本;其次,对于不与任何anchor匹配的Ground-Truth,选取具有最高匹配度的anchor计算补偿;为了实现稳定的训练,在训练期间选择调节输入IoU的影响,调节准则如公式(17):
其中t=iters/Max_Iteration,Max_Iteration是总迭代次数,α0是公式(17)的权重因子;
S43:Matching-Sensitive损失
为了进一步增强分类与回归之间的相关性,实现多方向的高精度检测,匹配度被融入训练过程,由此使用的匹配敏感损失函数MSL;其中分类公式(18)所示:
ψ代表所有anchors,ψp代表由匹配度阈值筛选出来的正样本,N代表anchors总数量,Np代表正样本anchor的数量,FL(*)为focal loss,wj表示匹配补偿因子,用于区分正样本不同的定位潜能;
对于每一个ground-truth box,首先计算其匹配度md,根据阈值筛选正样本,正样本的匹配度为mdpos,假设最大匹配度为mdmax,补偿值为Δmd,如公式(19)所示:
Δmd=1-mdmax (19)
过后,补偿值Vmd加到所有正样本的匹配度上构成补偿因子:
w=mdpos+Δmd (20)
由于匹配补偿因子设计合理,DAL针对不同的正样本区分对待;
匹配度是衡量anchor的定位能力,因此可以用于提升高质量的定位;对匹配敏感度的损失定义如公式(21)所示:
表示用于回归smooth-L1损失函数,为了避免正样本的损失贡献被与Ground-truth box空间对齐性差的负样本的损失所淹没,匹配补偿因子w被加到回归损失中;
S44:评价指标:采用ground-truth框RBgt和预测矩形框RBpred的度量IOU,用以验证包含斜拉线在内的有效探测区域的准确性:
其中IOUm表示测试数据集中M个检测到的IOU的平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110142118.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序