[发明专利]基于视觉的定位有效
申请号: | 201810862721.1 | 申请日: | 2018-08-01 |
公开(公告)号: | CN110163914B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 李月;许景涛;刘童 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06T7/73 | 分类号: | G06T7/73 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李舒;陈岚 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视觉 定位 | ||
本公开实施例提供了一种用于定位的方法、计算设备、系统以及计算机可读存储介质。该方法可以包括:获得图像;基于深度学习模型从所述图像的场景获得相机在世界坐标系下的第一坐标,基于所述第一坐标获得相机在世界坐标系下的初始坐标;以及基于相机在世界坐标系下的初始坐标通过帧间匹配确定相机在世界坐标系下的实时坐标。
技术领域
本公开涉及室内定位技术领域,尤其涉及一种基于视觉进行定位的方法、计算设备、系统以及计算机可读存储介质。
背景技术
目前,用于室内定位的方法主要包括基于视觉的定位方法,而基于视觉的定位方法又主要包括基于SLAM (simultaneous localization and mapping) 的定位方法以及基于深度学习的定位方法。
基于视觉里程计的定位方法是一种基于SLAM的定位方法。在基于视觉里程计的定位方法中,需要预先确定相机在世界坐标系下的初始坐标,然后再基于该初始坐标以及连续的图像序列通过帧间匹配进行定位。此外,该基于视觉里程计的定位方法还需要每间隔一段预设时间就进行累计误差的消除。
基于场景的端到端定位方法是一种基于深度学习的定位方法。该基于场景的定位方法基于相机所拍摄的图像的场景直接得到相机在世界坐标系下的三维相姿。
发明内容
根据本公开的一个方面,提供了一种基于视觉进行定位的方法。该方法可以包括:获得图像;基于深度学习模型从所述图像的场景获得相机在世界坐标系下的第一坐标,基于所述第一坐标获得相机在世界坐标系下的初始坐标;以及基于相机在世界坐标系下的初始坐标通过帧间匹配确定相机在世界坐标系下的实时坐标。
在一个实施例中,所述方法还可以包括:检测所述图像中是否包括标志物,其中所述标志物具有至少3个顶点。在这种情况下,所述基于所述第一坐标获得相机在世界坐标系下的初始坐标包括:响应于所述图像中不包括所述标志物,将所述第一坐标用作相机在世界坐标系下的初始坐标。
在一个实施例中,所述方法还可以包括:检测所述图像是否包括标志物,其中所述标志物具有至少3个顶点。在这种情况下,所述基于所述第一坐标获得相机在世界坐标系下的初始坐标包括:响应于所述图像中包括所述标志物,基于所述标志物和第一坐标获得相机在世界坐标系下的第二坐标;以及将所述第二坐标用作相机在世界坐标系下的初始坐标。
在一个实施例中,所述基于所述标志物和第一坐标获得相机在世界坐标系下的第二坐标可以包括:基于所述图像获得所述标志物的顶点在相机坐标系下的坐标;基于所述第一坐标从预先存储的多个标志物的顶点在世界坐标系下的坐标检索出所述图像中包括的所述标志物的顶点在世界坐标系下的坐标;基于所述图像中包括的所述标志物的顶点在相机坐标系下的坐标以及所述图像中包括的所述标志物的顶点在世界坐标系下的坐标获得相机坐标系相对于世界坐标系的旋转矩阵和平移矩阵;以及基于所述旋转矩阵和平移矩阵确定相机在世界坐标系下的第二坐标。
在一个实施例中,所述检测所述图像中是否包括标志物可以包括:基于单次多框检测器算法检测所述图像中是否包括标志物。
在一个实施例中,所述方法还可以包括,以预设的时间间隔更新所述相机在世界坐标系下的初始坐标;以及基于更新的相机在世界坐标系下的初始坐标通过帧间匹配确定相机在世界坐标系下的实时坐标。
在一个实施例中,每一次更新所述相机在世界坐标系下的初始坐标可以包括:如前所述那样基于实时获得的图像的场景和/或标志物获得相机在世界坐标系下的初始坐标。
在一个实施例中,所述深度学习模型是基于PoseNet网络的深度学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810862721.1/2.html,转载请声明来源钻瓜专利网。