[发明专利]一种基于GoogLeNet的红外图像识别方法有效
申请号: | 202011223719.3 | 申请日: | 2020-11-05 |
公开(公告)号: | CN112364979B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 张岩;李坡;武艳伟;刘光宏;李雨泽;丛明煜;于鲲;杨春玲;陈臻炜 | 申请(专利权)人: | 哈尔滨工业大学;中国电子科技集团公司信息科学研究院 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/00;G06T5/50;G06N3/04;G06N3/08;G06K9/62;G06V10/764;G06V10/82 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 刘景祥 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 googlenet 红外 图像 识别 方法 | ||
1.一种基于GoogLeNet的红外图像识别方法,其特征在于,所述红外图像识别方法包括以下步骤:
步骤一、数据增强:对红外数据集进行数据增强,包括像素级调整、模拟对象遮挡以及多图像拼接;
步骤二、改进GoogLeNet基本单元结构,搭建浅层Inception结构和深层Inception结构,其中,包含4层浅层Inception结构和4层深层Inception结构,
具体的,构建GoogLeNet基本单元Inception结构,分为浅层Inception和深层Inception,浅层Inception分成5个分支,分别为7*7卷积分支,5*5卷积分支,3*3卷积分支,池化分支,1*1卷积分支,并分别使用1*1卷积核进行参数降维,深层Inception结构使用3个1*3、3*1卷积组合替换7*7卷积核,2个1*3、3*1卷积组合替换5*5卷积核,1个1*3、3*1卷积组合替换3*3卷积核;
步骤三、引入空间注意力机制:使用空间注意力机制,牺牲少量的计算时间来提高模型的分类准确率,具体的,前一层Inception结构的输出经过SAM分支得到权重参数,尺寸与输入特征图尺寸完全一样,再与原图相乘,将结果送到下一个Inception结构,从而得到浅层特征图和深层特征图;
步骤四、引入特征金字塔融合:将浅层特征图和深层特征图进行加权融合,提高网络的识别精度和对于不同尺度目标的识别能力;
步骤五、引入Focal loss损失函数,并加入L1正则项:
loss=-ya(1-y')γlogy'-(1-y)(1-a)y'γlog(1-y')+λ(||W||2+||b||2)
式中y为标签值,y'为预测值,a是平衡因子,用于平衡正负样本本身的比例不均,γ负责控制难易样本的权重,λ为正则化系数;
步骤六、引入Mish激活函数:使用Mish激活函数替换ReLU函数;
步骤七、使用迁移学习:使用ImageNet数据集对模型进行初始化,并将预训练好的模型参数迁移到红外数据集,进行参数微调;
步骤八、进行红外图像识别:使用微调后的网络模型对红外数据集进行识别,得到识别结果。
2.根据权利要求1所述的一种基于GoogLeNet的红外图像识别方法,其特征在于,在步骤一中,所述像素级调整包括光度畸变和几何畸变,模拟对象遮挡分为像素级遮挡和区域级遮挡,多图像拼接包括像素级拼接和区域级拼接。
3.根据权利要求2所述的一种基于GoogLeNet的红外图像识别方法,其特征在于,所述光度畸变包括调整图像的亮度和加入噪声;所述几何畸变包括随机缩放、剪切、翻转和反旋转;所述像素级遮挡,即随机选择图像中的某一些点,填充一个随机的或互补的零值;所述区域级遮挡,即随机或均匀地选择图像中的多个矩阵区域,并将其全部替换为0;所述像素级拼接,即使用两个图像以不同的系数相乘并叠加,使用该系数值作为标签;所述区域级拼接,即将剪切后的图像覆盖到其他图像的矩阵区域,并根据混合区域的大小调整标签。
4.根据权利要求1所述的一种基于GoogLeNet的红外图像识别方法,其特征在于,在步骤二中,引入7*7的卷积核分支,提高网络的感受野大小,使用1*1卷积核进行参数降维,在网络深层结构使用3*1和1*3的卷积组合替换3*3、5*5、7*7的卷积核。
5.根据权利要求1所述的一种基于GoogLeNet的红外图像识别方法,其特征在于,在步骤三中,前一层Inception结构的输出分成两条分支,一条经过两次3×3的卷积操作后,使用Sigmoid激活函数映射到[0,1]区间得到注意力图,另一条分支将Inception输出直接与注意力图进行相乘,得到下一层Inception的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学;中国电子科技集团公司信息科学研究院,未经哈尔滨工业大学;中国电子科技集团公司信息科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011223719.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加密通信方法
- 下一篇:一种基于重力峰值相位差的纺织布料退浆盘
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序