[发明专利]一种红外-可见光融合的深度神经网络及其建模方法在审
申请号: | 202010919286.9 | 申请日: | 2020-09-04 |
公开(公告)号: | CN111985625A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 李学钧;戴相龙;蒋勇;何成虎;王晓鹏 | 申请(专利权)人: | 江苏濠汉信息技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06Q50/06;H04N5/265;H04N5/33 |
代理公司: | 北京化育知识产权代理有限公司 11833 | 代理人: | 秦丽 |
地址: | 226000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 红外 可见光 融合 深度 神经网络 及其 建模 方法 | ||
1.一种红外-可见光融合的深度神经网络,其特征在于,包括:
红外编码器模块,用于提取红外摄像机采集的红外图像特征,所述红外编码器模块包括三个Dwblock模块以及两个残差模块,红外图像依次输出至Dwblock模块、残差模块、Dwblock模块、Dwblock模块、残差模块以及1×1卷积层;
可见光编码器模块,用于提取可见光摄像机采集的可见光图像特征,所述可见光编码器模块包括两个Dwblock模块以及两个残差模块,可见光图像依次输出至Dwblock模块、残差模块、Dwblock模块、残差模块以及1×1卷积层;
解码器模块,将所述红外编码器模块与所述可见光编码器模块融合为融合编码器模块,所述融合编码器模块输出至所述解码器模块;以及
模型训练模块,所述解码器模块输出至所述模型训练模块,所述模型训练模块用于对所述深度神经网络模型进行训练。
2.根据权利要求1所述的红外-可见光融合的深度神经网络,其特征在于,所述Dwblock模块依次由数据填充、纵向卷积操作、批归一化处理、卷积操作和批归一化处理构成,其中,所述纵向卷积操作指输入图像有N个通道,就采用N个卷积核进行卷积,其中N为正整数。
3.根据权利要求2所述的红外-可见光融合的深度神经网络,其特征在于,所述数据填充操作指将所述红外图像或所述可见光图像的边界进行扩充,针对每个输入xi所述批处理归一化过程为:xi=(xi-u)/(sqrt((xi-v)2)+e),其中,u为输入{x1,x2,x3,…,xn}的均值,v为输入{x1,x2,x3,...,xn}的方差,e是一个小小偏置,防止分母趋向于0。
4.根据权利要求3所述的红外-可见光融合的深度神经网络,其特征在于,对所述批处理归一化的结果xi进行了scale加上shift操作,即xi=scale*xi+shift,其中scale和shift通过学习得到。
5.根据权利要求4所述的红外-可见光融合的深度神经网络,其特征在于,当输入为x时,所述残差模块输出为F(x)+x。
6.一种基于权利要求5所述的红外-可见光融合的深度神经网络的建模方法,其特征在于,包括如下步骤:
S10通过红外摄像机以及可见光摄像机分别采集红外图像与可见光图像,分别在所述红外图像与所述可见光图像中标注出危险源位置,构建双光危险源分割数据集;
S20构建可见光编码器模块以及红外编码器模块,并将可见光编码器模块以及红外编码器模块融合获得融合编码器模块,进而将所述双光危险源分割数据集输入所述融合编码器模块获得融合特征值;
S30构建解码模块,将所述融合特征值输入所述解码模块,将所述解码模块输出至softmax层,完成建模。
7.根据权利要求6所述的红外-可见光融合的建模方法,其特征在于,还包括S40步骤,位于所述S30步骤之后,交叉熵损失函数和梯度下降算法进行模型训练,损失函数定义如下:
其中,ti为真实值,yi代表softmax第i个输出值,i表示类别索引,C总的类别个数,vi表示解码模块的第i个输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏濠汉信息技术有限公司,未经江苏濠汉信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010919286.9/1.html,转载请声明来源钻瓜专利网。