[发明专利]一种基于双通道生成-融合网络的图像模态变换方法有效
申请号: | 201911203850.0 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110956581B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 王晗;施佺;余佩伦;沈克成 | 申请(专利权)人: | 南通大学 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06T3/40;G06T5/00;G06T5/40;G06T5/50;G06T7/11;G06V10/74;G06V10/75;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 许洁 |
地址: | 226000*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双通道 生成 融合 网络 图像 变换 方法 | ||
1.一种基于双通道生成-融合网络的图像模态变换方法,其特征在于,包括如下步骤:
步骤1)利用双目摄像机采集红外-可见光图像对,并通过图像配准获取视野与分辨率均相同的红外-可见光双模态数据集;
步骤2)建立“双通道生成-融合网络”,利用红外-可见光双模态数据集训练,获取各通道生成神经网络权值、亮度阈值;
步骤3)利用训练完毕的“双通道生成-融合网络”对待测的红外图像进行模态变换;
所述步骤1)中:
首先,将可见光彩色图像转换为灰度图像ICCD,并且在灰度图像ICCD和红外图像IIR中分别提取SIFT特征点;然后,以红外图像IIR中每个SIFT特征点FIRi为中心,在给定的搜索范围内在可见光灰度图像ICCD中寻找SIFT候补特征点集合{FCCD1,FCCD2,…FIRn};接着,计算红外图像IIR特征点FIRi与灰度图像ICCD候补特征点集合中每一个特征点FCCDj之间的相似度,最后,根据最大相似度完成FIRi和{FCCD1,FCCD2,…FIRn}之间的可见光-红外SIFT特征点匹配;
在红外图像IIR中所有的SIFT特征点匹配之后,利用RANSAC算法从可见光-红外SIFT特征点对集合中,估计可见光图像ICCD与红外图像IIR之间的转换矩阵M;最后,根据M矩阵将灰度图像ICCD转换为与红外图像IIR在视野和分辨率均相同的图像Icolor;
所述步骤2)为:
“双通道生成-融合网络”由三个模块构成:“基于残差单元的图像生成网络”、“基于稠密单元的图像生成网络”和“图像融合”模块;
“基于残差单元的图像生成网络”的输入为红外图像IIR,网络结构如下:下采样层1、下采样层2、下采样层3、9个残差单元、上采样层1、上采样层2、上采样层3;其中,第n个残差单元结构如下:卷积层n-1、卷积层n、元素相加层;元素相加层的输出为卷积层n-1与卷积层n的输出特征图按照元素相加的结果;“基于残差单元的图像生成网络”输出为与输入IIR分辨率相同的可见光生成图像IRES;
“基于稠密单元的图像生成网络”的输入为红外图像IIR,网络结构如下:下采样层1、下采样层2、下采样层3、9个稠密单元、上采样层1、上采样层2、上采样层3;其中,第n个稠密单元结构如下:卷积层n-1、向量拼接层1、卷积层n、向量拼接层2、卷积层n+1;向量拼接层1的输出为卷积层n-2与卷积层n-1的输出特征向量的连接结果;向量拼接层2的输出为卷积层n-2、卷积层n-1和卷积层n的输出特征向量的连接结果;“基于稠密单元的图像生成网络”输出为与输入IIR分辨率相同的可见光生成图像IDENSE;
“图像融合”模块的输入为IRES和IDENSE,该模块的结构如下:“图像分割≥亮度阈值”、“图像分割亮度阈值”和“图像拼接”模块;图像融合过程如下:首先,将“基于残差单元的图像生成网络”的输出IRES图像,利用亮度阈值b*进行分割,保留亮度值大于等于b*的像素点,获得分割结果ISeg1;接着,将“基于稠密单元的图像生成网络”的输出IDENSE图像,利用亮度阈值b*进行分割,保留亮度值小于b*的像素点,获得分割结果ISeg2;最后,将两次分割的图像进行拼接,获取最终生成图像IOut=ISeg1+ISeg2;
如上述建立“双通道生成-融合网络”后,利用红外-可见光双模态数据集训练,获取各通道生成神经网络权值、亮度阈值;
所述步骤3)中:
待测红外图像IIR经过双通道生成网络分别生成IRES、IDENSE;然后,利用步骤2)训练获取的最优亮度阈值b*对IRES、IDENSE分别进行分割,获得分割图像ISEG1,ISEG2;最后将分割后的图像进行拼接融合:Iout=ISEG1+ISEG2。
2.根据权利要求1所述的基于双通道生成-融合网络的图像模态变换方法,其特征在于:所述的利用红外-可见光双模态数据集训练,获取各通道生成神经网络权值、亮度阈值;具体如下:
1)利用对抗生成网络的训练方法单独训练“基于残差单元的图像生成网络”,获取其网络权值,并且保存数据;
2)利用对抗生成网络的训练方法单独训练“基于稠密单元的图像生成网络”,获取其网络权值,并且保存数据;
3)利用各通道的生成图像与真值图像的灰度直方图的拟合结果,估计图像分割、拼接的亮度阈值:
3.1)设定亮度阈值的搜索区间[b0,255];设bi为亮度阈值,且bi∈[b0,255];
3.2)遍历训练数据获取“基于残差单元的图像生成网络”的生成图像IRES(k),k=1,…,N;N为训练样本数,IRES(k)为第k个训练样本的残差单元网络生成图像;遍历训练数据获取“基于稠密单元的图像生成网络”的生成图像IDENSE(k),k=1,…,N,N为训练样本数,IDENSE(k)为第k个训练样本的稠密单元网络生成图像;
3.3)利用亮度阈值bi,分别对IRES(k)、IDENSE(k)进行分割后拼接融合,其中,k=1,…,N,IFUSION(bi,k)=ISeg1(k)+ISeg2(k),k=1,…,N;
3.4)分别计算IRES(k)、IDENSE(k)、IFUSION(bi,k),与训练样本中可见光图像真值IGT(k)之间误差MSE(IRES(k),IGT(k))、MSE(IDENSE(k),IGT(k))、MSE(IFUSION(k),IGT(k)),其中,k=1,…,N;
3.5)计算同时满足MSE(IFUSION(k),IGT(k))MSE(IDENSE(k),IGT(k))和MSE(IFUSION(k),IGT(k))MSE(IRES(k),IGT(k))条件的样本个数N*,k=1,…,N;
3.6)计算满足3.5)条件的N*个MSE误差的平均值MSE*(bi)
3.7)计算亮度阈值bi的优化目标函数
式中,μ1是MSE的最优希望值,μ2是N*的最优希望值,σ1,σ2是归一化常数;
3.8)求取最佳亮度阈值b*
b*=argmax(J(bi)),bi=b0,...,255。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911203850.0/1.html,转载请声明来源钻瓜专利网。