[发明专利]基于注意力机制的高动态范围多曝光图像融合模型及方法在审

专利信息
申请号: 202111428200.3 申请日: 2021-11-26
公开(公告)号: CN114331931A 公开(公告)日: 2022-04-12
发明(设计)人: 白本督;李俊鹏;孙爱晶 申请(专利权)人: 西安邮电大学
主分类号: G06T5/50 分类号: G06T5/50;G06K9/62;G06N3/04;G06N3/08;G06V10/774;G06V10/82
代理公司: 西北工业大学专利中心 61204 代理人: 刘新琼
地址: 710121 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 注意力 机制 动态 范围 曝光 图像 融合 模型 方法
【权利要求书】:

1.一种基于注意力机制的高动态范围多曝光图像融合模型,其特征在于包括特征提取模块、注意力机制模块以及特征重建模块,将目标场景两张不同曝光图像分别输入到结构相同的两组特征提取模块中,获得目标场景两张不同曝光图像对应的两组高维特征图;随后将上述两组高维特征图作为输入分别送入相应的注意力机制模块,得到重建融合图像所需的纯净高维特征;特征重建模块将注意力机制模块输出的两组不同曝光图像的高维特征融合重建为高动态范围图像。

2.一种采用权利要求1所述的模型实现的基于注意力机制的高动态范围多曝光图像融合方法,其特征在于步骤如下:

步骤1:读取训练的欠曝光图像U和过曝光图像O;将读取的U和O剪切成若干个子图像M,M的大小为w×h×c,w和h表示M的宽和高,c表示M的通道数,再将剪裁的子图像M进行数据增强;

步骤2:以子图像M作为输入源,通过特征提取模块构建单层卷积神经网络层,其中卷积核大小为W×H,通过卷积神经层分别将U和O转化为64维的特征f1,f1的大小为w×h×64,计算方法如下:

f1=C1(M) (1)

式中,C1表示对应卷积操作;

步骤3:以f1为输入源,输入到Unet网络进行图像特征的多尺度特征提取,得到确定包含64通道的高维多尺度特征f2,f2大小为w×h×64,计算方法如下:

f2=U(f1) (2)

式中,U表示Unet网络的卷积操作;

步骤4:构建两个结构相同的注意力机制模块A,使用注意力机制模块A分别对Unet网络输出的不同曝光图像的特征图f2进行Squeeze操作,采用全局平均池化方式将通道上整个空间特征编码为全局特征,计算公式如下:

式中,Fsq(·)表示Squeeze操作,i,j表示像素点,RC表示C维度,fc为Squeeze操作的结果;然后对全局特征采用Excitation操作,为了降低模型复杂度以及提升泛化能力,采用两个全连接操作,全连接之间使用ReLU激活函数进行非线性处理,最后通过归一化函数Sigmoid输出权值向量,Excitation操作使得网络学习各通道间的关系,也得到不同通道的权值f3,计算方式如下:

f3=Fex(fc,W)=σ(g(fc,W))=σ(W2ReLU(W1fc)) (4)

式中,表示W1维度为表示W2维度为r为缩放因子;

步骤5:运用乘法运算将Unet网络输出的图像特征f2与注意力机制学习到的各通道权值f3相乘得到最终图像特征f4,计算方法如下:

f4=Fscale(f2,f3)=f2·f3 (5)

式中,·表示矩阵相乘运算;

步骤6:通过拼接操作欠曝和过曝图像的高维图像特征fu,4,fo,4得到特征图F0,F0的大小为w×h×128,计算方式如下:

F0=concat(fu,4+fo,4) (6)

式中,fu,4和fo,4分别表示欠曝光图像,过曝光图像经过注意力机制后得到的图像特征,concat表示特征拼接操作;

步骤7:以F0为输入源,通过特征重建模块得到高动态范围图像,特征重建模块首先利用单层卷积神经网络层将拼接的特征图F0转化成64通道的特征图F1,F1大小为w×h×64,其次将特征图F1提供给DRDB单元输出特征图F2,其中DRDB单元是基于扩张卷积改进残差稠密单元得到的,最后利用2个卷积层依次卷积特征图F2得到特征图F3,最后得到高动态范围图像,其中F3的大小为w×h×16,计算方法如下:

F1=C1(F0) (7)

F2=DRDB(F1) (8)

F3=C2(F2) (9)

HDR=C3(F3) (10)

式中,DRDB表示扩张残差稠密单元卷积操作,C1,C2,C3表示单层卷积层,HDR表示高动态范围图像;

步骤8:设计损失函数,进行迭代,更新模型,所述的损失函数为:

Loss=λLSSIM+Lcontent (16)

LSSIM=αoSSIMO,FuSSIMU,F (12)

Lcontent=βOLO,FULU,F (15)

其中,SSIMO,F,SSIMU,F分别表示过曝图像O和欠曝图像U与融合图像F的结构相似性,λ表示超参数,αo和αu分别为过曝图像O和欠曝图像U的权重系数,βO和βU分别为过曝图像O和欠曝图像U的权重系数,LO,F、LU,F分别表示过曝图像O和欠曝图像U与融合图像F的内容相似性;

步骤9:读取需要处理的欠曝光U和过曝光图像O,通过参数完备的训练模型得到高动态范围图像HDR。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111428200.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top