[发明专利]多尺度增强UNet被动式太赫兹图像固定背景扣除方法在审
申请号: | 202011117258.1 | 申请日: | 2020-10-19 |
公开(公告)号: | CN113838083A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 徐帆;商智高;吴启晖;陈朝晖;宋明;黄旭阳 | 申请(专利权)人: | 南京航空航天大学;海华电子企业(中国)有限公司 |
主分类号: | G06T7/194 | 分类号: | G06T7/194;G06T5/50;G06T5/00;G06T3/40;G06K9/32;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 阚梦诗 |
地址: | 210016*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 尺度 增强 unet 被动式 赫兹 图像 固定 背景 扣除 方法 | ||
1.一种多尺度增强UNet被动式太赫兹图像固定背景扣除方法,其特征在于,包括以下步骤:
S1:采集被动式太赫兹图像数据,对被动式太赫兹图像数据进行去噪处理,所述去噪处理包括多尺度双边滤波;
S2:使用去噪后的所述被动式太赫兹图像数据,并进行背景带标记,构建数据增强训练集;
S3:设计用于图像语义分割的UNet卷积神经网络模型,所述UNet卷积神经网络模型包括编码层和解码层;
S4:使用所述数据增强训练集的图像数据对所述UNet卷积神经网络模型进行训练,生成已训练UNet卷积神经网络模型;
S5:使用所述已训练UNet卷积神经网络模型对去噪后待测的被动式太赫兹图像数据进行语义分割、去除固定背景带。
2.根据权利要求1所述的多尺度增强UNet被动式太赫兹图像固定背景扣除方法,其特征在于:S1中,所述多尺度双边滤波包括:
对被动式太赫兹图像数据I进行双边滤波,输出经双边滤波的被动式太赫兹图像I′=I·weight,其中weight为权重阵列,表示为其中Gs=exp(-Δd2/(2·σs2)),Gr=exp(-ΔI2/(2·σr2)),Δd为图像I的每个像素点与中心像素点[ic,jc]的欧式距离,即ΔI是每个像素与中心像素的强度差,即ΔI=|I(ic,jc)-I(i,j)|,σs和σr分别是空间域和值域的滤波平滑参数;选取σs和σr的不同组合Φ={[σs,1,σr,1],[σs,2,σr,2],…,[σs,m,σr,m]},分别进行尺度为1,2,…,m的多尺度去噪,获得多尺度去噪集Itotal={I2,1,I2,2,…,I2,m}。
3.根据权利要求2所述的多尺度增强UNet被动式太赫兹图像固定背景扣除方法,其特征在于,所述S2具体包括,对所述多尺度去噪样本Itotal的图像数据进行背景带标记,生成标签数据label,将标签数据label和多尺度去噪样本label一一对应,生成{Itotal,label}作为学习网络模型的数据增强训练集。
4.根据权利要求3所述的多尺度增强UNet被动式太赫兹图像固定背景扣除方法,其特征在于:所述S3具体包括,
所述编码层和解码层分别设为5层;
每层编码层包括卷积操作层和池化层,所述卷积操作层包括卷积核大小3×3的卷积层和激活函数,所述激活函数采用ReLU函数,重复n次,所述池化层使用的是最大池化函数;
每层解码层包括卷积操作层和上采样层,解码层中卷积操作层将图像数据的通道数变为该层卷积核个数,解码层中上采样层将图像数据的大小加倍,将解码层的结果与编码层保存的图像大小相同的特征图拼接融合,之后再进行3×3的卷积,重复n次,最后一层的卷积核大小为1×1。
其中4层解码层输出的结果分别与4层编码层保存的特征图进行拼接融合。
5.根据权利要求4所述的多尺度增强UNet被动式太赫兹图像固定背景扣除方法,其特征在于:所述S4包括,保存已训练UNet卷积神经网络模型与参数权重;
训练交叉熵损失函数其中x为当前像素,Ω为所有类别标签,ak(x)是第k个通道的softmax激活函数,K是所有类别标签的数量,l是每个像素对应的真实标签;
权重函数wc(x)是用于平衡类别频率的权重图,d1(x)表示到最近物体边界的距离,d2(x)代表到第二近物体边界的距离,w0为距离权重,σ为作用范围权重。
6.根据权利要求5所述的多尺度增强UNet被动式太赫兹图像固定背景扣除方法,其特征在于:所述S5包括,将数据增强训练集的图像数据分割为背景、背景带和感兴趣区域,将背景和背景带部分做去除,保留感兴趣区域;
其中,输入图像数据为I(h,w,c),h为图像数据的高度,w为图像数据的宽度,c为图像数据的通道数,数据增强训练集的图像数据经过第一层编码层的卷积操作层后为(h,w,c′),c′为第一层卷积操作层的卷积核个数,并将输出的特征图像记为f1,图像数据经第一层编码层的池化层后为(h/2,w/2,c′),以此类推,数据增强训练集的图像数据每经过一次编码层的卷积操作层后,数据增强训练集的图像数据的通道数变为该层卷积核个数,并将输出的特征图像保存,再经过池化层后数据增强训练集的图像数据的大小减半;
经过5层编码层后,数据增强训练集的图像数据转入解码层,经过第一层解码层的上采样层为(h/8,w/8,c″),c″为第一层解码层中卷积操作层的卷积核个数,再将输出的图像数据与f4,f4为第四层编码层保存的特征图像数据,将图像在第三维度进行拼接融合为(h/8,w/8,c″+c4),c4为f4图像数据的通道数,再经过第二层解码层的卷积操作层为(h/8,w/8,c″′),c″′为该卷积操作层的卷积核个数,以此类推,最后一层卷积操作层输出的图像数据为(h,w,c″″),c″″为最后一层上解码层中卷积操作层的卷积核个数,最后一层卷积操作层的卷积核个数为cout,图像数据I(h,w,c)经过UNet卷积神经网络模型后,得到输出图像数据I′(h,w,cout),输出I′(h,w,cout)的背景、背景带区域和感兴趣区域的像素对应不同的值,将预测的背景、背景带区域上色为黑色,完成背景带扣除工作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学;海华电子企业(中国)有限公司,未经南京航空航天大学;海华电子企业(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011117258.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于控制车辆的充电入口的锁定的设备和方法
- 下一篇:一种稻谷晾晒翻边装置