[发明专利]一种基于双通道生成-融合网络的图像模态变换方法有效

专利信息
申请号: 201911203850.0 申请日: 2019-11-29
公开(公告)号: CN110956581B 公开(公告)日: 2022-08-02
发明(设计)人: 王晗;施佺;余佩伦;沈克成 申请(专利权)人: 南通大学
主分类号: G06T3/00 分类号: G06T3/00;G06T3/40;G06T5/00;G06T5/40;G06T5/50;G06T7/11;G06V10/74;G06V10/75;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 许洁
地址: 226000*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 双通道 生成 融合 网络 图像 变换 方法
【权利要求书】:

1.一种基于双通道生成-融合网络的图像模态变换方法,其特征在于,包括如下步骤:

步骤1)利用双目摄像机采集红外-可见光图像对,并通过图像配准获取视野与分辨率均相同的红外-可见光双模态数据集;

步骤2)建立“双通道生成-融合网络”,利用红外-可见光双模态数据集训练,获取各通道生成神经网络权值、亮度阈值;

步骤3)利用训练完毕的“双通道生成-融合网络”对待测的红外图像进行模态变换;

所述步骤1)中:

首先,将可见光彩色图像转换为灰度图像ICCD,并且在灰度图像ICCD和红外图像IIR中分别提取SIFT特征点;然后,以红外图像IIR中每个SIFT特征点FIRi为中心,在给定的搜索范围内在可见光灰度图像ICCD中寻找SIFT候补特征点集合{FCCD1,FCCD2,…FIRn};接着,计算红外图像IIR特征点FIRi与灰度图像ICCD候补特征点集合中每一个特征点FCCDj之间的相似度,最后,根据最大相似度完成FIRi和{FCCD1,FCCD2,…FIRn}之间的可见光-红外SIFT特征点匹配;

在红外图像IIR中所有的SIFT特征点匹配之后,利用RANSAC算法从可见光-红外SIFT特征点对集合中,估计可见光图像ICCD与红外图像IIR之间的转换矩阵M;最后,根据M矩阵将灰度图像ICCD转换为与红外图像IIR在视野和分辨率均相同的图像Icolor

所述步骤2)为:

“双通道生成-融合网络”由三个模块构成:“基于残差单元的图像生成网络”、“基于稠密单元的图像生成网络”和“图像融合”模块;

“基于残差单元的图像生成网络”的输入为红外图像IIR,网络结构如下:下采样层1、下采样层2、下采样层3、9个残差单元、上采样层1、上采样层2、上采样层3;其中,第n个残差单元结构如下:卷积层n-1、卷积层n、元素相加层;元素相加层的输出为卷积层n-1与卷积层n的输出特征图按照元素相加的结果;“基于残差单元的图像生成网络”输出为与输入IIR分辨率相同的可见光生成图像IRES

“基于稠密单元的图像生成网络”的输入为红外图像IIR,网络结构如下:下采样层1、下采样层2、下采样层3、9个稠密单元、上采样层1、上采样层2、上采样层3;其中,第n个稠密单元结构如下:卷积层n-1、向量拼接层1、卷积层n、向量拼接层2、卷积层n+1;向量拼接层1的输出为卷积层n-2与卷积层n-1的输出特征向量的连接结果;向量拼接层2的输出为卷积层n-2、卷积层n-1和卷积层n的输出特征向量的连接结果;“基于稠密单元的图像生成网络”输出为与输入IIR分辨率相同的可见光生成图像IDENSE

“图像融合”模块的输入为IRES和IDENSE,该模块的结构如下:“图像分割≥亮度阈值”、“图像分割亮度阈值”和“图像拼接”模块;图像融合过程如下:首先,将“基于残差单元的图像生成网络”的输出IRES图像,利用亮度阈值b*进行分割,保留亮度值大于等于b*的像素点,获得分割结果ISeg1;接着,将“基于稠密单元的图像生成网络”的输出IDENSE图像,利用亮度阈值b*进行分割,保留亮度值小于b*的像素点,获得分割结果ISeg2;最后,将两次分割的图像进行拼接,获取最终生成图像IOut=ISeg1+ISeg2

如上述建立“双通道生成-融合网络”后,利用红外-可见光双模态数据集训练,获取各通道生成神经网络权值、亮度阈值;

所述步骤3)中:

待测红外图像IIR经过双通道生成网络分别生成IRES、IDENSE;然后,利用步骤2)训练获取的最优亮度阈值b*对IRES、IDENSE分别进行分割,获得分割图像ISEG1,ISEG2;最后将分割后的图像进行拼接融合:Iout=ISEG1+ISEG2

2.根据权利要求1所述的基于双通道生成-融合网络的图像模态变换方法,其特征在于:所述的利用红外-可见光双模态数据集训练,获取各通道生成神经网络权值、亮度阈值;具体如下:

1)利用对抗生成网络的训练方法单独训练“基于残差单元的图像生成网络”,获取其网络权值,并且保存数据;

2)利用对抗生成网络的训练方法单独训练“基于稠密单元的图像生成网络”,获取其网络权值,并且保存数据;

3)利用各通道的生成图像与真值图像的灰度直方图的拟合结果,估计图像分割、拼接的亮度阈值:

3.1)设定亮度阈值的搜索区间[b0,255];设bi为亮度阈值,且bi∈[b0,255];

3.2)遍历训练数据获取“基于残差单元的图像生成网络”的生成图像IRES(k),k=1,…,N;N为训练样本数,IRES(k)为第k个训练样本的残差单元网络生成图像;遍历训练数据获取“基于稠密单元的图像生成网络”的生成图像IDENSE(k),k=1,…,N,N为训练样本数,IDENSE(k)为第k个训练样本的稠密单元网络生成图像;

3.3)利用亮度阈值bi,分别对IRES(k)、IDENSE(k)进行分割后拼接融合,其中,k=1,…,N,IFUSION(bi,k)=ISeg1(k)+ISeg2(k),k=1,…,N;

3.4)分别计算IRES(k)、IDENSE(k)、IFUSION(bi,k),与训练样本中可见光图像真值IGT(k)之间误差MSE(IRES(k),IGT(k))、MSE(IDENSE(k),IGT(k))、MSE(IFUSION(k),IGT(k)),其中,k=1,…,N;

3.5)计算同时满足MSE(IFUSION(k),IGT(k))MSE(IDENSE(k),IGT(k))和MSE(IFUSION(k),IGT(k))MSE(IRES(k),IGT(k))条件的样本个数N*,k=1,…,N;

3.6)计算满足3.5)条件的N*个MSE误差的平均值MSE*(bi)

3.7)计算亮度阈值bi的优化目标函数

式中,μ1是MSE的最优希望值,μ2是N*的最优希望值,σ1,σ2是归一化常数;

3.8)求取最佳亮度阈值b*

b*=argmax(J(bi)),bi=b0,...,255。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911203850.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top