[发明专利]基于单张图像的多任务增强的深度估计系统在审
申请号: | 201811316680.2 | 申请日: | 2018-11-07 |
公开(公告)号: | CN111160378A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 漆进;胡顺达;秦金泽 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611731 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 单张 图像 任务 增强 深度 估计 系统 | ||
1.一种基于单张图像的多任务增强的深度估计系统,所述方法包括:
(1)对带深度标签图片和带有分割标签的图片和带有深度标签和分割标签的图片,进行预处理,得到训练样本和验证样本;
(2)构建双任务模型,利用(1)中得到的训练样本,间隔着用带有深度标签的图片和带有分割标签的图片对网络进行训练,得到训练好的模型;
(3)利用带有深度标签和分割标签的数据对(2)训练得到的模型进行微调,得到最后的模型;
(4)对带有深度标签的测试图片按照(1)中的预处理方法,得到处理后的测试图片;
(5)利用(3)中训练好的网络,预测(4)中处理后的预测图片,得到预测结果。
2.根据权利要求1所述的方法,其特征在于,所述步骤(1)中具体包括:
(11)对样本库中带有分割标签的图片,进行左右翻转,一定比例的拉伸的数据增强,对所有图片都进行改变对比度,饱和度,光照的数据增强,和随机裁剪,得到数据增强后图片,将其按照一定比例分成训练样本和验证样本,样本大小是224×224;
(12)对带分割标签的图片的分割标签进行如(11)中的左右翻转和一定比例的拉伸,保持与图片的形变的一致,对所有被裁剪的图片的标签进行与图片一致的裁剪;
(13)用(12)中的数据增强后的带分割标签的图片和带深度信息的图片分别进行归一化,得到可训练样本和验证样本。
3.根据权利要求1所述的方法,其特征在于,所述步骤(2)中具体包括:
(21)首先构建一个如图(1)的网络,其中网络使用四倍下采样残差网络模块提取特征(Residual Block),之后特征依次通过卷积模块(convolution block),池化层(poolingblock),直到特征图大小是原图的八分之一,再经过一个多尺度的模块(multiscaleblock)融合特征,之后和之前的卷积模块输出特征连接,进入二插值上采样模块(interpolation)和反卷积模块(deconvolution block),最后是一个卷积和二插值联合模块输出图像的分割预测和深度估计;
网络中的卷积模块和反卷积模块如图(2)是由许多不同尺寸的卷积模块堆叠而成,卷积模块和反卷积模块不同之处在于卷积层分别是卷积层和反卷积层,模块是先由一个3×3的卷积核,再分别将特征输出到带1×1卷积核的卷积层的通道,带3×3卷积核的卷积层和pool层的通道,带5×1卷积核的卷积层核带1×5的卷积核的卷积层的通道,带3×1卷积核的卷积层核带1×3的卷积核的卷积层的通道,最后由一个带3×3的卷积核卷积层融合特征,之后重复刚刚的多通道卷积,构建如图(2)的卷积模块,该模块中的卷积层都是卷积层加上批次标准化层(batch normlization)和指数线性单元层(Exponential Linera Unit)三种层堆叠的;
网络中的多尺度特征融合模块如图(3)所示,由四路不同尺度的特征提取通道组成,模块是先由一个3×3的卷积核,再分别进入到带1×1卷积核的卷积层,带1×3卷积核的卷积层和带3×1卷积核的卷积层的通道;带1×1卷积核的卷积层,带1×5卷积核的卷积层和带5×1卷积核的卷积层的通道;带1×1卷积核的卷积层,带3×3卷积核,12膨胀系数的膨胀卷积层,带1×1卷积核的卷积层的通道;带1×1卷积核的卷积层,带3×3卷积核,18膨胀系数的膨胀卷积层,带1×1卷积核的卷积层的通道,最后由一个带3×3的卷积核卷积层融合特征,该模块中的卷积层都是卷积层加上批次标准化层(batch normlization)和指数线性单元层(Exponential Linera Unit)三种层堆叠的;
网络中最后的卷积层和二插值上采样层如图(4)所示,特征图进入该模块时分别流向两个相似的通道,一个预测深度信息,一个预测分割信息,网络采用卷积层加二插值上采样层的堆叠,具体是卷积层,之后分别进入二倍上采样后卷积层,再二倍上采样和四倍上采样,融合后一个3×3卷积层输出;
(22)使用(21)中构建的网络训练(13)中得到的训练样本,使用批量梯度下降法训练网络,带分割信息的样本和带深度信息的样本分批次间隔输入模型中训练;
其中在预测分割时,使用交叉熵损失函数作为目标函数,其中损失函数如下:
上式中,所述xk代表第k个样本预测正确的标签的预测概率,yk代表第k个样本的的标签的one hot编码,即yk=1;
为了防止过拟合,在代价函数后再加上一个L2正则项,得到的代价函数如下:
其中在预测深度信息时,使用的差的平方和为损失函数;
上式中,所述xk代表第k个像素的预测深度距离,yk代表第k个像素的实际深度距离,
网络以以上的损失函数最小为目标,以(13)的验证样本的准确度为标准,得到预训练网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811316680.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种木塑下框梃
- 下一篇:一种双向可调整体式斜块机械补偿工作台
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序