[发明专利]用于生成信息的方法和装置有效
申请号: | 201810287515.2 | 申请日: | 2018-03-30 |
公开(公告)号: | CN108734693B | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 亢乐;包英泽 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 目标图像 图像 子网络 卷积神经网络 方法和装置 生成信息 特征图像 卷积核 信息生成 定点数 视差图 存储 申请 | ||
本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取第一目标图像和第二目标图像;将第一目标图像和第二目标图像输入卷积神经网络,其中,卷积神经网络包括至少一组子网络,至少一组子网络中的每组子网络包括卷积层以及与该卷积层连接的相关层;对于每个卷积层,获取存储为八位定点数的、该卷积层的卷积核,并基于该卷积层所输入的两个图像和所获取的卷积核,分别生成特征图像;对于每个相关层,基于该相关层所连接的卷积层所生成的两个特征图像,确定用于输入该相关层的两个图像,基于该相关层所输入的两个图像,生成相关图像;基于所生成的相关图像,生成视差图。该实施方式提高了信息生成的效率和准确性。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及用于生成信息的方法和装置。
背景技术
双目视觉是模拟人类视觉原理,通过计算机被动感知距离的方法。实践中,可以从两个或者多个点观察一个物体,获取在不同视角下的图像,根据图像之间像素的匹配关系,通过三角测量原理计算出像素之间的偏移,进而获取物体的三维信息。
通常,得到了物体的景深信息,就可以计算出物体与相机之间的实际距离、物体的三维大小以及两点或多点之间的实际距离。
发明内容
本申请实施例提出了用于生成信息的方法和装置。
第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:获取第一目标图像和第二目标图像,其中,第一目标图像和第二目标图像为双目视觉图像;将第一目标图像和第二目标图像输入预先训练的卷积神经网络,其中,卷积神经网络包括至少一组子网络,至少一组子网络中的每组子网络包括卷积层以及与该卷积层连接的相关层;对于至少一组子网络所包括的卷积层中的每个卷积层,获取存储为八位定点数的、该卷积层的卷积核,并基于该卷积层所输入的两个图像和所获取的卷积核,分别生成所输入的两个图像的特征图像;对于至少一组子网络所包括的相关层中的每个相关层,基于该相关层所连接的卷积层所生成的两个特征图像,确定用于输入该相关层的两个图像,基于该相关层所输入的两个图像,生成用于表征该相关层所输入的两个图像的相关程度的相关图像;基于所生成的相关图像,生成用于表征第一目标图像和第二目标图像的视差的视差图。
在一些实施例中,基于该相关层所连接的卷积层所生成的两个特征图像,确定用于输入该相关层的两个图像,包括:基于该相关层所连接的卷积层所生成的特征图像中的第二特征图像,生成该相关层所连接的卷积层所生成的特征图像中第一特征图像的预测图像;将所生成的第一特征图像的预测图像以及该相关层所连接的卷积层所生成的特征图像中的第一特征图像确定为用于输入该相关层的两个图像。
在一些实施例中,基于该卷积层所输入的两个图像和所获取的卷积核,分别生成所输入的两个图像的特征图像,包括:对于该卷积层所输入的两个图像中的每个图像,执行以下步骤:将该图像转化为存储为八位定点数的初始图像;对存储为八位定点数的初始图像和所获取的卷积核进行卷积计算,获得存储为六十四位定点数的初始特征图像;基于所获得的存储为六十四位定点数的初始特征图像,生成该图像的特征图像。
在一些实施例中,基于所获得的存储为六十四位定点数的初始特征图像,生成该图像的特征图像,包括:将所获得的存储为六十四位定点数的初始特征图像转化为存储为十六位浮点数的初始特征图像;将存储为十六位浮点数的初始特征图像确定为该图像的特征图像。
在一些实施例中,基于该相关层所输入的两个图像,生成用于表征该相关层所输入的两个图像的相关程度的相关图像,包括:对于该相关层所输入的两个图像中的每个图像,将该图像转化为存储为一位定点数的初始图像;对所转化的两个存储为一位定点数的初始图像进行相关运算,获得存储为六十四位定点数的初始相关图像;基于所获得的存储为六十四位定点数的初始相关图像,生成用于表征该相关层所输入的两个图像的相关程度的相关图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810287515.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序