[发明专利]一种基于小样本学习的铁路场景不常见入侵目标识别方法在审
申请号: | 202210811818.6 | 申请日: | 2022-07-11 |
公开(公告)号: | CN115393802A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 郭保青;余祖俊;朱力强;王尧;阮涛 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06V20/54 | 分类号: | G06V20/54;G06V10/74;G06V10/774;G06V10/764;G06V10/80;G06V10/82;B61L23/04 |
代理公司: | 北京卫平智业专利代理事务所(普通合伙) 11392 | 代理人: | 闫萍 |
地址: | 100044*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 样本 学习 铁路 场景 常见 入侵 目标 识别 方法 | ||
本发明涉及一种基于小样本学习的铁路场景不常见入侵目标识别方法。本发明可以实时采集铁路沿线相机获取的铁路场景图像,利用改进的度量元学习网络模型进行铁路场景中不常见入侵目标的识别。该模型包括预训练的特征映射网络,自学习类中心微调网络,距离度量模块三部分,并采用中心相关损失函数进行度量元学习模型的训练。本发明可以对铁路空场景以及场景中包含但不限于列车、落石、行人、泥石流等类别的图像进行分类识别。当列车经过时不报警,而当铁路场景中有落石、行人、泥石流等异物入侵铁路限界时则发出报警信息,通过有线或无线方式提醒相关人员。
技术领域
本发明涉及铁路运营安全监测技术领域,具体说是一种基于小样本学习的铁路场景不常见入侵目标识别方法。
背景技术
保障列车行车安全是铁路安全保障系统的重中之重。其中泥石流等自然灾害或人为原因导致的人员和异物侵限等线路危情是造成铁路上重大事故的重要原因之一,泥石流和落石等灾害发生概率较低但危害极大,由于高速列车制动距离远大于司机目视距离,当司机发现灾害后再采取紧急制动措施为时已晚。同时,这类图像很难收集到足够的样本用于传统深度学习识别模型的网络训练,如何在仅有少量图像样本的基础上实现铁路场景中泥石流、落石等入侵异物的准确识别对保障铁路运营安全具有重要意义。
近几年,随着人工智能飞速发展,基于智能视频分析的方法因为安装简单和造价等优势被越来越多地应用在铁路异物入侵检测系统中,但基于传统深度学习方法往往需要收集足够多的训练样本使得网络具有更好的泛化性能。而在实际中,一方面线路落石、泥石流等铁路危情往往无法收集到足够多的样本,另一方面随着社会不断发展,新的异物类别会不断出现,而传统深度学习无法识别这些新类别的入侵异物。为了解决上述问题,本发明通过改进度量元学习模型设计了适用于铁路场景中的小样本学习方法并设计了相应的系统,用于铁路场景中泥石流、落石、列车、行人等目标的识别。
度量元学习是目前众多小样本学习方法中效果比较好的方法,该方式重点研究两部分内容:一是设计好的特征映射模块,使得同类别样本之间距离更近,不同类别样本之间距离更远,二是学习一种好的度量模型更好地描述不同类别样本之间的差距。
特征映射模块的性能直接决定了模型最终的检测精度。目前的特征映射模块大多是利用卷积块堆叠提取特征,所有特征对最终分类决策的贡献一样。但实际上,待检测的特征才是网络需要重点关注的内容,对分类贡献应该最大。为解决这一问题,本发明提出了一种改进的通道注意力模块,利用提取的特征生成每个通道上特征权重用作后续分类中的距离度量。
在类别中心的初始化方面,SNELL J等人采用支持集中所有样本特征均值作为所有类别中心,Finn C等人则直接将支持集中样本特征融合,但有时噪声样本可能会分布在偏离特征空间中较远的位置,并不适合用作类别中心的初始化,因此本文提出一种类别中心微调算法,让网络自己学习得到每个类别的中心。
度量元学习算法一般直接采用元训练方式对网络进行训练,并采用交叉熵损失函数优化网络参数;元训练可以让网络学会快速学习,但由于缺少先验知识,特征提取能力较弱;同时交叉熵损失只考虑能否分类正确,并没有考虑到同类样本特征在特征空间中的分布关系。为提高网络的特征提取能力,同时让同类别特征在样本空间中分布更加紧凑,本文引入模型预训练方式和中心相关损失函数来提升检测效果。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种基于小样本学习的铁路场景不常见入侵目标识别方法,能够在仅需要几张训练样本的情况下,实现对入侵的异物进行实时检测、分类识别。
为达到以上目的,本发明采取的技术方案是:
一种基于小样本学习的铁路场景不常见入侵目标识别方法,其特征在于:
采用改进的度量元学习网络模型进行铁路场景中不常见入侵目标的识别,改进的度量元学习模型包括预训练的特征映射网络,自学习类中心微调网络,距离度量模块三部分;并采用中心相关损失函数进行特征映射网络训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210811818.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于云木香加工用的切片装置
- 下一篇:抗爆冲牵引器