[发明专利]一种基于小样本学习的铁路场景不常见入侵目标识别方法在审
申请号: | 202210811818.6 | 申请日: | 2022-07-11 |
公开(公告)号: | CN115393802A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 郭保青;余祖俊;朱力强;王尧;阮涛 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06V20/54 | 分类号: | G06V20/54;G06V10/74;G06V10/774;G06V10/764;G06V10/80;G06V10/82;B61L23/04 |
代理公司: | 北京卫平智业专利代理事务所(普通合伙) 11392 | 代理人: | 闫萍 |
地址: | 100044*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 样本 学习 铁路 场景 常见 入侵 目标 识别 方法 | ||
1.一种基于小样本学习的铁路场景不常见入侵目标识别方法,其特征在于:
采用改进的度量元学习网络模型进行铁路场景中不常见入侵目标的识别,改进的度量元学习模型包括预训练的特征映射网络,自学习类中心微调网络,距离度量模块三部分;并采用中心相关损失函数进行特征映射网络训练。
2.如权利要求1所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法,其特征在于,包括如下步骤:
步骤1,首先将具有与铁路图像特征类似的小样本公共数据集输入到随机初始化的特征映射网络中进行预训练,得到预训练的特征映射网络及其参数;
步骤2,利用小样本公共数据集建立元训练集,输入到步骤1获得的预训练的特征映射网络中进行度量元训练,得到元训练的特征映射网络及其参数;
步骤3,将铁路空场景图像、入侵目标样本图像建立小样本支持集S,输入至步骤2获得的元训练的特征映射网络中,利用元训练的特征映射网络将上述入侵目标样本映射到同一个特征空间;
步骤4,将步骤3获得的支持集图像特征输入到自学习类中心微调网络中,学习得到各图像类别的中心表示;
步骤5,将待测图像输入到步骤2获得的元训练的特征映射网络中,获得待测图像的图像特征,然后利用距离度量模块计算待测图像特征与步骤4得到的各图像类别中心之间的相似度,得到入侵目标识别结果。
3.如权利要求1所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法,其特征在于:步骤1中所述的特征映射网络为基于通道注意力机制的特征映射网络,该特征映射网络由两部分组成:
第一部分由依次连接的四个残差块构成,每个残差块后附带一层最大池化层;
第二部分为改进通道注意力模块。
4.如权利要求3所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法,其特征在于:所述改进通道注意力模块包括:
信息压缩部分,将卷积后的特征通过并行的全局最大池化层Fm(·)和全局平均池化层Fa(·)在空间维度上进行压缩;
信息激励部分Fσ(·),将上述全局池化层和全局平均池化层的特征相加融合,利用激活函数将融合后的特征归一化到0-1之间得到通道注意力权重值;
通道特征增强Fscale(·),将获得的通道注意力权重值与原特征值F相乘,从而实现对关键通道的注意力增强。
5.如权利要求3所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法,其特征在于:采用模型预训练方法获得所述的特征映射网络的初始网络参数,再进行元训练,具体训练步骤如下:
步骤1-1,在基于通道注意力机制的特征映射网络上用标准的交叉熵损失训练一个分类器,并在训练的过程中采用一边训练一边元验证的方式,保存在N-way K-shot设置下元验证准确率最高的特征映射网络作为预训练后的模型;
步骤1-2,提取预训练后的模型的网络参数,迁移到度量元学习中,采用元训练的方式继续训练网络。
6.如权利要求1所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法,其特征在于:所述自学习类中心微调网络处理算法步骤如下:
步骤2-1,对于支持集S中类别为k的所有样本Sk={xi|i=1,...,N},经过特征映射网络后得到特征根据求得的均值作为可学习参数类k的中心原型在特征空间的初始值,如下式(1):
步骤2-2,根据式(1)依次得到支持集S中所有类中心原型的初始值,利用softmax函数,归一化支持集中样本到每个初始类中心的距离,得到属于类k的概率,如式(2):
其中d为两特征向量在特征空间的欧氏距离;
步骤2-3,据式(3)计算交叉熵损失:
7.如权利要求1所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法,其特征在于:所述采用中心相关损失函数进行特征映射网络训练,具体为:
中心损失Lc表达式具体如下式(4):
上式中λ为超参数,在训练的过程中可以用于控制类内的距离;xi表示某一入侵目标样本在特征空间中的特征值,ck表示各图像类别的类别中心;
同时,在对特征映射网络进行训练中,每次迭代时要采用支持集特征均值重新初始化类别中心;
最后采用交叉熵损失和中心损失结合构建下式(5)表示的中心相关损失函数用于特征映射网络训练:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210811818.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于云木香加工用的切片装置
- 下一篇:抗爆冲牵引器