[发明专利]一种基于深度卷积神经网络的单目视觉深度估计方法有效
申请号: | 201811229351.4 | 申请日: | 2018-10-22 |
公开(公告)号: | CN109448039B | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 周武杰;袁建中;吕思嘉;钱亚冠;何成;王海江 | 申请(专利权)人: | 浙江科技学院 |
主分类号: | G06T7/50 | 分类号: | G06T7/50 |
代理公司: | 宁波奥圣专利代理有限公司 33226 | 代理人: | 周珏 |
地址: | 310023 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 卷积 神经网络 目视 估计 方法 | ||
本发明公开了一种基于深度卷积神经网络的单目视觉深度估计方法,其先构建深度卷积神经网络,其包括输入层、隐层和输出层;隐层包括编码框架和译码框架;然后使用训练集中的单目图像作为原始输入图像,输入到深度卷积神经网络中进行训练,得到训练集中的每幅原始的单目图像对应的估计深度图像;接着通过计算训练集中的单目图像对应的估计深度图像与对应的真实深度图像之间的损失函数值,得到深度卷积神经网络训练模型及最优权值矢量和最优偏置项;再将待预测的单目图像输入到深度卷积神经网络训练模型中,并利用最优权值矢量和最优偏置项,预测得到对应的预测深度图像;优点是其预测精度高。
技术领域
本发明涉及一种单目视觉深度估计技术,尤其是涉及一种基于深度卷积神经网络的单目视觉深度估计方法。
背景技术
经济的高速发展带来了人们生活水平的不断提升,随着人们对好的生活质量的要求逐渐增强,交通的便利性也越来越好。汽车作为交通中的重要一环,其发展更加被重视。这几年人工智能大火,无人驾驶也是近年来较为热门的话题之一,并且在百度宣布无人驾驶车进入批量生产即将投入使用之后,无人驾驶的热潮持续提高。车前的单目视觉深度估计是无人驾驶领域的一部分,它可以有效的保障汽车行驶过程中的安全。
单目视觉深度估计的方法主要分为传统的方法和深度学习的方法。传统的方法使用在深度预测的领域并没有取得令人满意的结果,其估计精度远低于实际应用中所需要的要求;深度学习的出现给予了单目视觉深度预测极大的帮助,借助于深度学习的方法,通过端到端训练,在使用大量数据集后机器可以不停的学到深度预测所需要的特征信息,进而不断提高它的结果精度,使得单目视觉深度预测的实际应用可以得到实现。如:Eigen等人首次将深度学习应用到了单目视觉深度估计任务中,其提出结合两个深度网络:粗规模网络预测全局深度分布和精细规模网络以局部细化深度图,粗规模网络首先在全局级别预测场景的深度,然后通过精细规模网络在局部区域内进行细化。该方法的两个尺度的输入都是原始图像,此外,粗规模网络的输出作为附加的第一层图像特征传递到精细规模网络,但是这种结合粗规模网络和精细规模网络的神经网络没有足够的深度来提取更多的深度信息以获得准确性更高的深度特征。
发明内容
本发明所要解决的技术问题是提供一种基于深度卷积神经网络的单目视觉深度估计方法,其预测精度高。
本发明解决上述技术问题所采用的技术方案为:一种基于深度卷积神经网络的单目视觉深度估计方法,其特征在于包括训练阶段和测试阶段两个过程;
所述的训练阶段过程的具体步骤为:
步骤1_1:选取N幅原始的单目图像及每幅原始的单目图像对应的真实深度图像,并构成训练集,将训练集中的第n幅原始的单目图像记为Qn(x,y),将训练集中与Qn(x,y)对应的真实深度图像记为其中,N为正整数,N≥1000,n为正整数,1≤n≤N,1≤x≤R,1≤y≤L,R表示Qn(x,y)和的宽度,L表示Qn(x,y)和的高度,R和L均能被2整除;
步骤1_2:构建深度卷积神经网络:深度卷积神经网络包括输入层、隐层和输出层;隐层包括编码框架和译码框架;
对于输入层,输入层的输入端接收一幅原始输入图像,输入层的输出端输出原始输入图像给隐层;其中,要求输入层的输入端接收的原始输入图像的宽度为R、高度为L;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江科技学院,未经浙江科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811229351.4/2.html,转载请声明来源钻瓜专利网。