[发明专利]自监督学习的全景图像水平矫正方法及系统有效
申请号: | 202010446601.0 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111784586B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 周杰;吴垚垚;邓磊;陈宝华;李健;邓杰仁;于恒;李永强 | 申请(专利权)人: | 清华大学 |
主分类号: | G06T3/60 | 分类号: | G06T3/60;G06T7/73;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 石茵汀 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 监督 学习 全景 图像 水平 矫正 方法 系统 | ||
1.一种自监督学习的全景图像水平矫正方法,其特征在于,包括以下步骤:
步骤S1,构建训练图像库;
步骤S2,利用所述训练图像库中的训练图像对卷积神经网络进行自监督式训练,直至所述卷积神经网络的误差函数收敛;
步骤S3,将所述训练图像库中的待矫正图像输入至训练完成的卷积神经网络中,推导出拍摄所述待矫正图像时相机的俯仰角和滚筒角;以及
步骤S4,对所述俯仰角和所述滚筒角进行欧拉角推算旋转矩阵计算,得到相机位姿的旋转矩阵,根据所述相机位姿的旋转矩阵矫正所述待矫正图像,合成水平图像;
其中,所述训练图像库中的每幅全景图像均为水平角度;
其中,所述步骤S2包括:
利用欧拉角中的俯仰角和滚筒角作为监督信息;
通过所述监督信息对所述训练图像库中的每张全景图像进行迭代训练,生成若干张旋转后的非水平图像;
当所述非水平图像的旋转角度与所述监督信息中的旋转角度的误差最小,完成所述卷积神经网络的训练。
2.根据权利要求1所述的自监督学习的全景图像水平矫正方法,其特征在于,在对所述全景图像进行迭代训练前,将所述全景图像映射到球面上。
3.一种自监督学习的全景图像水平矫正系统,其特征在于,包括:
构建模块,用于构建训练图像库;
训练模块,用于利用所述训练图像库的训练图像对卷积神经网络进行自监督式训练,直至所述卷积神经网络的误差函数收敛;
推导模块,用于将所述训练图像库中的待矫正图像输入至训练完成的卷积神经网络中,推导出拍摄所述待矫正图像时相机的俯仰角和滚筒角;以及
矫正模块,用于对所述俯仰角和所述滚筒角进行欧拉角推算旋转矩阵计算,得到相机位姿的旋转矩阵,根据所述相机位姿的旋转矩阵矫正所述待矫正图像,合成水平图像;
其中,所述训练图像库中的每幅全景图像均为水平角度;
其中,所述训练模块进一步用于:
确定单元,用于利用欧拉角中的俯仰角和滚筒角作为监督信息;
训练单元,用于通过所述监督信息对所述训练图像库中的每幅全景图像进行迭代训练,生成若干张旋转后的非水平图像;
判断单元,用于当所述非水平图像的旋转角度与所述监督信息中的旋转角度的误差最小,完成所述卷积神经网络的训练。
4.根据权利要求3所述的自监督学习的全景图像水平矫正系统,其特征在于,在对所述全景图像进行迭代训练前,将所述全景图像映射到球面上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010446601.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序