[发明专利]一种基于GoogLeNet的红外图像识别方法有效

专利信息
申请号: 202011223719.3 申请日: 2020-11-05
公开(公告)号: CN112364979B 公开(公告)日: 2022-07-12
发明(设计)人: 张岩;李坡;武艳伟;刘光宏;李雨泽;丛明煜;于鲲;杨春玲;陈臻炜 申请(专利权)人: 哈尔滨工业大学;中国电子科技集团公司信息科学研究院
主分类号: G06T7/00 分类号: G06T7/00;G06T5/00;G06T5/50;G06N3/04;G06N3/08;G06K9/62;G06V10/764;G06V10/82
代理公司: 哈尔滨市阳光惠远知识产权代理有限公司 23211 代理人: 刘景祥
地址: 150001 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 googlenet 红外 图像 识别 方法
【权利要求书】:

1.一种基于GoogLeNet的红外图像识别方法,其特征在于,所述红外图像识别方法包括以下步骤:

步骤一、数据增强:对红外数据集进行数据增强,包括像素级调整、模拟对象遮挡以及多图像拼接;

步骤二、改进GoogLeNet基本单元结构,搭建浅层Inception结构和深层Inception结构,其中,包含4层浅层Inception结构和4层深层Inception结构,

具体的,构建GoogLeNet基本单元Inception结构,分为浅层Inception和深层Inception,浅层Inception分成5个分支,分别为7*7卷积分支,5*5卷积分支,3*3卷积分支,池化分支,1*1卷积分支,并分别使用1*1卷积核进行参数降维,深层Inception结构使用3个1*3、3*1卷积组合替换7*7卷积核,2个1*3、3*1卷积组合替换5*5卷积核,1个1*3、3*1卷积组合替换3*3卷积核;

步骤三、引入空间注意力机制:使用空间注意力机制,牺牲少量的计算时间来提高模型的分类准确率,具体的,前一层Inception结构的输出经过SAM分支得到权重参数,尺寸与输入特征图尺寸完全一样,再与原图相乘,将结果送到下一个Inception结构,从而得到浅层特征图和深层特征图;

步骤四、引入特征金字塔融合:将浅层特征图和深层特征图进行加权融合,提高网络的识别精度和对于不同尺度目标的识别能力;

步骤五、引入Focal loss损失函数,并加入L1正则项:

loss=-ya(1-y')γlogy'-(1-y)(1-a)y'γlog(1-y')+λ(||W||2+||b||2)

式中y为标签值,y'为预测值,a是平衡因子,用于平衡正负样本本身的比例不均,γ负责控制难易样本的权重,λ为正则化系数;

步骤六、引入Mish激活函数:使用Mish激活函数替换ReLU函数;

步骤七、使用迁移学习:使用ImageNet数据集对模型进行初始化,并将预训练好的模型参数迁移到红外数据集,进行参数微调;

步骤八、进行红外图像识别:使用微调后的网络模型对红外数据集进行识别,得到识别结果。

2.根据权利要求1所述的一种基于GoogLeNet的红外图像识别方法,其特征在于,在步骤一中,所述像素级调整包括光度畸变和几何畸变,模拟对象遮挡分为像素级遮挡和区域级遮挡,多图像拼接包括像素级拼接和区域级拼接。

3.根据权利要求2所述的一种基于GoogLeNet的红外图像识别方法,其特征在于,所述光度畸变包括调整图像的亮度和加入噪声;所述几何畸变包括随机缩放、剪切、翻转和反旋转;所述像素级遮挡,即随机选择图像中的某一些点,填充一个随机的或互补的零值;所述区域级遮挡,即随机或均匀地选择图像中的多个矩阵区域,并将其全部替换为0;所述像素级拼接,即使用两个图像以不同的系数相乘并叠加,使用该系数值作为标签;所述区域级拼接,即将剪切后的图像覆盖到其他图像的矩阵区域,并根据混合区域的大小调整标签。

4.根据权利要求1所述的一种基于GoogLeNet的红外图像识别方法,其特征在于,在步骤二中,引入7*7的卷积核分支,提高网络的感受野大小,使用1*1卷积核进行参数降维,在网络深层结构使用3*1和1*3的卷积组合替换3*3、5*5、7*7的卷积核。

5.根据权利要求1所述的一种基于GoogLeNet的红外图像识别方法,其特征在于,在步骤三中,前一层Inception结构的输出分成两条分支,一条经过两次3×3的卷积操作后,使用Sigmoid激活函数映射到[0,1]区间得到注意力图,另一条分支将Inception输出直接与注意力图进行相乘,得到下一层Inception的输入。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学;中国电子科技集团公司信息科学研究院,未经哈尔滨工业大学;中国电子科技集团公司信息科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011223719.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top