[发明专利]深度估计装置的训练方法、深度估计设备及存储介质有效
申请号: | 201711128851.4 | 申请日: | 2017-11-15 |
公开(公告)号: | CN109785376B | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 李斐;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06T7/55 | 分类号: | G06T7/55;G06N3/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;韩雪梅 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 估计 装置 训练 方法 设备 存储 介质 | ||
1.一种对深度估计装置进行训练的方法,所述装置用于估计图像的深度,所述方法包括:
向n个所述装置中的每个装置输入n个样本图像,输入至所述装置的n个样本图像的顺序被设置成使得各个装置所接收的第1个样本图像彼此不同,n为大于等于2的整数;
利用所述装置所包含的第一神经网络,基于n个样本图像来估计第1个样本图像的深度图和从拍摄其他样本图像的相机的坐标系变换至拍摄第1个样本图像的相机的坐标系的变换矩阵;
基于所述变换矩阵来构建使得n个装置相互关联的第一损失函数,其包括:
计算从第j个样本图像到第k个样本图像的变换矩阵和从第k个样本图像到第j个样本图像的变换矩阵的乘积与单位矩阵之间的差距,作为第j个样本图像与第k个样本图像之间的第一局部损失函数,其中j≠k且j,k∈(1,2,……,n),和
将n个样本图像中两两样本图像之间的所有第一局部损失函数相加,以得到所述第一损失函数;以及
通过使至少包括所述第一损失函数和第三损失函数的总体损失函数最小化来确定所述装置的参数,其中,所述第三损失函数表示下述中的至少之一:所估计的深度图与真实深度图之间的差距、所估计的变换矩阵与真实变换矩阵之间的差距和所估计的光流与真实光流之间的差距。
2.根据权利要求1所述的方法,还包括:
利用所述装置所包含的与所述第一神经网络耦接的第二神经网络,基于n个样本图像来估计其他样本图像相对于第1个样本图像的光流,其中第一神经网络基于n个样本图像和所估计的光流来估计第1个样本图像的深度图和从其他样本图像的相机的坐标系变换至第1个样本图像的相机的坐标系的变换矩阵;以及
基于所估计的光流来构建使得n个装置相互关联的第二损失函数,
其中,通过使还包括所述第二损失函数总体损失函数最小化来确定所述参数。
3.根据权利要求2所述的方法,其中,构建所述第二损失函数包括:
计算第j个样本图像相对于第k个样本图像的光流与第k个样本图像相对于第j个样本图像的光流的负数之间的差距,作为第j个样本图像与第k个样本图像之间的第二局部损失函数,其中j≠k且j,k∈(1,2,……,n);以及
将n个样本图像中两两样本图像之间的所有第二局部损失函数相加,以得到所述第二损失函数。
4.根据权利要求2或3所述的方法,其中,所述总体损失函数为所述第一损失函数、所述第二损失函数和所述第三损失函数的加权和。
5.根据权利要求1至3中任一项所述的方法,其中,所述第一神经网络为编码-解码网络。
6.根据权利要求2或3所述的方法,其中,所述第二神经网络为编码-解码网络。
7.一种深度估计设备,包括:经由根据权利要求1至6中任一项所述的方法训练的一个或更多个深度估计装置。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有能够由处理器运行来执行以下操作的程序:
向用于估计图像的深度的n个深度估计装置中的每个装置输入n个样本图像,输入至所述深度估计装置的n个样本图像的顺序被设置成使得各个深度估计装置所接收的第1个样本图像彼此不同,n为大于等于2的整数;
利用所述深度估计装置所包含的第一神经网络,基于n个样本图像来估计第1个样本图像的深度图和从拍摄其他样本图像的相机的坐标系变换至拍摄第1个样本图像的相机的坐标系的变换矩阵;
基于所述变换矩阵来构建使得n个深度估计装置相互关联的第一损失函数,其包括:
计算从第j个样本图像到第k个样本图像的变换矩阵和从第k个样本图像到第j个样本图像的变换矩阵的乘积与单位矩阵之间的差距,作为第j个样本图像与第k个样本图像之间的第一局部损失函数,其中j≠k且j,k∈(1,2,……,n),和
将n个样本图像中两两样本图像之间的所有第一局部损失函数相加,以得到所述第一损失函数;以及
通过使至少包括所述第一损失函数和第三损失函数的总体损失函数最小化来确定所述深度估计装置的参数,其中,所述第三损失函数表示下述中的至少之一:所估计的深度图与真实深度图之间的差距、所估计的变换矩阵与真实变换矩阵之间的差距和所估计的光流与真实光流之间的差距。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711128851.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于3D建模的距离检测方法及装置
- 下一篇:弓网状态的检测方法