[发明专利]一种基于GoogLeNet的红外图像识别方法有效
申请号: | 202011223719.3 | 申请日: | 2020-11-05 |
公开(公告)号: | CN112364979B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 张岩;李坡;武艳伟;刘光宏;李雨泽;丛明煜;于鲲;杨春玲;陈臻炜 | 申请(专利权)人: | 哈尔滨工业大学;中国电子科技集团公司信息科学研究院 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/00;G06T5/50;G06N3/04;G06N3/08;G06K9/62;G06V10/764;G06V10/82 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 刘景祥 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 googlenet 红外 图像 识别 方法 | ||
本发明公开了一种基于GoogLeNet的红外图像识别方法,属于图像识别技术领域。通过数据增强扩充训练数据集,降低了对数据集大小的依赖。通过改进GoogLeNet的网络结构提高模型对于尺度变化的鲁棒性。将在ImageNet典型数据集上训练好的GoogLeNet模型参数进行迁移学习,在红外数据集上进行参数微调,提高训练速度。本发明解决了目标尺度变化问题、样本不均衡问题、训练样本不足的问题。同时提升了训练的稳定性,有效提高了红外图像的识别准确率,提升了模型的泛化性和鲁棒性。
技术领域
本发明涉及一种基于GoogLeNet的红外图像识别方法,属于图像识别技术领域。
背景技术
图像识别,是指对图像进行对象识别,以识别各种不同模式的目标和对象的技术。它涵盖图像匹配、图像分类、图像检索、人脸检测、行人检测等技术,在互联网搜索引擎、自动驾驶、医学分析、遥感分析等领域具有广泛的应用价值。
现有的图像识别技术主要分为基于特征提取的传统算法和基于卷积神经网络的深度学习算法。传统的特征提取算法针对不同应用场景难以选取稳定有效的特征。基于卷积神经网络的图像识别算法对训练集的大小要求严格,难以应对红外场景中数据缺乏的问题。此外,这种卷积神经网络不具备尺度不变性,一定程度上限制了图像识别技术的进一步发展。本发明使用迁移学习的方法,通过改进GoogLeNet的网络结构,解决尺度变化和训练集缺乏的问题。
发明内容
本发明的目的是提出一种基于GoogLeNet的红外图像识别方法,使用迁移学习的方法,通过改进GoogLeNet的网络结构,以解决尺度变化和训练集缺乏的问题。
一种基于GoogLeNet的红外图像识别方法,所述红外图像识别方法包括以下步骤:
步骤一、数据增强:对红外数据集进行数据增强,包括像素级调整、模拟对象遮挡以及多图像拼接;
步骤二、改进GoogLeNet基本单元结构,搭建浅层Inception结构和深层Inception结构;
步骤三、引入空间注意力机制:使用空间注意力机制,牺牲少量的计算时间来提高模型的分类准确率;
步骤四、引入特征金字塔融合:将浅层特征图和深层特征图进行加权融合,提高网络的识别精度和对于不同尺度目标的识别能力;
步骤五、引入Focal loss损失函数,并加入L1正则项:
loss=-ya(1-y')γlogy'-(1-y)(1-a)y'γlog(1-y')+λ(||W||+||b||)
式中y为标签值,y'为预测值,a是平衡因子,用于平衡正负样本本身的比例不均,γ负责控制难易样本的权重,λ为正则化系数;
步骤六、引入Mish激活函数:使用Mish激活函数替换ReLU函数;
步骤七、使用迁移学习:使用ImageNet数据集对模型进行初始化,并将预训练好的模型参数迁移到红外数据集,进行参数微调;
步骤八、进行红外图像识别:使用微调后的网络模型对红外数据集进行识别,得到识别结果。
进一步的,在步骤一中,所述像素级调整包括光度畸变和几何畸变,模拟对象遮挡分为像素级遮挡和区域级遮挡,多图像拼接包括像素级拼接和区域级拼接。
进一步的,所述光度畸变包括调整图像的亮度和加入噪声;所述几何畸变包括随机缩放、剪切、翻转和反旋转;所述像素级遮挡,即随机选择图像中的某一些点,填充一个随机的或互补的零值;所述区域级遮挡,即随机或均匀地选择图像中的多个矩阵区域,并将其全部替换为0;所述像素级拼接,即使用两个图像以不同的系数相乘并叠加,使用该系数值作为标签;所述区域级拼接,即将剪切后的图像覆盖到其他图像的矩阵区域,并根据混合区域的大小调整标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学;中国电子科技集团公司信息科学研究院,未经哈尔滨工业大学;中国电子科技集团公司信息科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011223719.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加密通信方法
- 下一篇:一种基于重力峰值相位差的纺织布料退浆盘
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序