[发明专利]用于生成信息的方法和装置有效
申请号: | 201810286286.2 | 申请日: | 2018-03-30 |
公开(公告)号: | CN108648226B | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 亢乐;包英泽 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06T7/593 | 分类号: | G06T7/593;G06N3/04 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子网络 目标图像 特征提取 级联 视差图生成 神经网络 尾级 方法和装置 生成信息 特征图像 信息生成 输出 视差图 视差 申请 | ||
本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:通过获取包括第一目标图像和第二目标图像的目标图像组;获取预先训练的神经网络,其中,神经网络包括至少两个级联的子网络,至少两个级联的子网络中的各级子网络分别包括特征提取层和视差图生成层;对于神经网络,执行以下视差图生成步骤:将目标图像组输入至少两个级联的子网络中首级子网络的特征提取层,获得由至少两个级联的子网络中的尾级子网络的特征提取层输出的特征图像组;将尾级子网络的特征提取层输出的特征图像组输入尾级子网络的视差图生成层,获得用于表征第一目标图像和第二目标图像的视差的视差图。该实施方式实现了富于准确性的信息生成。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及用于生成信息的方法和装置。
背景技术
双目视觉是模拟人类视觉原理,使用计算机被动感知距离的方法。从两个或者多个点观察一个物体,获取在不同视角下的图像,根据图像之间像素的匹配关系,通过三角测量原理计算出像素之间的偏移,进而获取物体的三维信息。
通常,得到了物体的景深信息,就可以计算出物体与相机之间的实际距离、物体的三维大小以及两点或多点之间的实际距离。
发明内容
本申请实施例提出了用于生成信息的方法和装置。
第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:获取包括第一目标图像和第二目标图像的目标图像组,其中,第一目标图像和第二目标图像为双目视觉图像;获取预先训练的神经网络,其中,神经网络包括至少两个级联的子网络,至少两个级联的子网络中的各级子网络分别包括特征提取层和视差图生成层,各级子网络的特征提取层从首至尾依次连接,且各级子网络的视差图生成层从尾至首依次连接;对于神经网络,执行以下视差图生成步骤:将目标图像组输入至少两个级联的子网络中首级子网络的特征提取层,获得由至少两个级联的子网络中的尾级子网络的特征提取层输出的特征图像组;将尾级子网络的特征提取层输出的特征图像组输入尾级子网络的视差图生成层,获得由首级子网络的视差图生成层输出的、用于表征第一目标图像和第二目标图像的视差的视差图。
在一些实施例中,对于至少两个级联的子网络中除尾级子网络外的每级子网络,该级子网络所包括的视差图生成层包括依次连接的形变层、相关层和反卷积层;其中,该级子网络的形变层用于将该级子网络的特征提取层输出的特征图像组中的第一特征图像和该级子网络的下一级子网络的视差图生成层返回的视差图作为输入,输出该级子网络的特征提取层输出的特征图像组中的第二特征图像的预测图像;该级子网络的相关层用于将该级子网络的形变层输出的预测图像和该级子网络的特征提取层输出的特征图像组中的第二特征图像作为输入,输出该级子网络的形变层输出的预测图像与该级子网络的特征提取层输出的特征图像组中的第二特征图像的相关图;该级子网络的反卷积层用于将该级子网络的相关层输出的相关图和该级子网络的下一级子网络的视差图生成层输出的视差图作为输入,获得由该级子网络的视差图生成层输出的视差图,该级子网络的下一级子网络为与该级子网络相邻的两个子网络中,沿尾级子网络至首级子网络方向用于向该级子网络输入视差图的子网络。
在一些实施例中,尾级子网络的视差图生成层包括第一视差图生成层和第二视差图生成层;以及将尾级子网络的特征提取层输出的特征图像组输入尾级子网络的视差图生成层,获得由首级子网络的视差图生成层输出的、用于表征第一目标图像和第二目标图像的视差的视差图,包括:将尾级子网络的特征提取层输出的特征图像组输入尾级子网络的视差图生成层中的第一视差图生成层,获得由尾级子网络的第一视差图生成层输出的初始视差图;将尾级子网络的特征提取层输出的特征图像组和所获得的初始视差图输入尾级子网络的视差图生成层中的第二视差图生成层,获得由首级子网络的视差图生成层输出的、用于表征第一目标图像和第二目标图像的视差的视差图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810286286.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:目标图像获取系统与方法
- 下一篇:打印费用计算方法、装置及打印系统