[发明专利]一种视觉定位方法、装置、设备及可读存储介质在审
申请号: | 202080001067.0 | 申请日: | 2020-05-26 |
公开(公告)号: | CN111758118A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 陈尊裕;吴珏其;胡斯洋;陈欣;吴沛谦;张仲文 | 申请(专利权)人: | 蜂图科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/08;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 徐丽 |
地址: | 中国香港荔枝角长沙湾*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视觉 定位 方法 装置 设备 可读 存储 介质 | ||
一种视觉定位方法、装置、设备及可读存储介质,该方法包括:获取广角照片,并对广角照片进行随机分割,获得待测图集;将待测图集输入至定位模型进行定位识别,得到多个候选定位;定位模型为利用实景地图中的全景照片训练后的神经网络模型;利用多个候选定位,确定出最终定位。在本申请中,基于实景地图中的全景照片对神经网络模型进行训练即可得到一个定位模型,且基于该定位模型可以完成视觉定位,解决了视觉定位训练样本采集困难的问题。
技术领域
本申请涉及定位技术领域,特别是涉及一种视觉定位方法、装置、设备及可读存储介质。
背景技术
基于机器学习的视觉定位原理:利用大量的带有位置标记的真实场景照片进行训练,得到一个输入为照片(RGB数值矩阵),输出为具体的位置的神经网络模型。获得训练好的神经网络模型后,只需要用户对环境拍摄一张照片就可以得到具体的拍摄位置。
这种方法需要对使用环境采集大量的照片样本作为训练数据集。例如,在一些文献中记载,为了实现对35米宽的街角店铺进行视觉定位,需要采集330张照片,而为了实现对140米的街道(只针对一侧进行定位)进行视觉定位,需采集1500多张照片;为了实现某工厂定位,需将工厂划分为18个区域,每个区域需要拍摄200幅图像。可见,为了保证视觉定位效果,需要采集大量的现场照片作为训练数据,而且这些照片必须保证拍摄到场景中的每个角落,非常耗费时间和人力。
综上所述,如何解决视觉定位中样本采集困难等问题,是目前本领域技术人员急需解决的技术问题。
发明内容
本申请的目的是提供一种视觉定位方法、装置、设备及可读存储介质,利用实景地图中的全景照片来对神经网络模型进行训练,可解决视觉定位中样本采集困难的问题。
为解决上述技术问题,本申请提供如下技术方案:
一种视觉定位方法,包括:
获取广角照片,并对所述广角照片进行随机分割,获得待测图集;
将所述待测图集输入至定位模型进行定位识别,得到多个候选定位;所述定位模型为利用实景地图中的全景照片训练后的神经网络模型;
利用多个所述候选定位,确定出最终定位。
优选地,所述利用多个所述候选定位,确定出最终定位,包括:
对多个所述候选定位进行聚类处理,并利用聚类结果对多个所述候选定位进行筛选;
利用筛选得到的若干候选定位构建几何图形;
将所述几何图形的几何中心作为所述最终定位。
优选地,还包括:
利用所述最终定位,计算多个所述候选定位的标准方差;
将所述标准方差作为所述最终定位的定位误差。
优选地,训练所述神经网络模型的过程,包括:
从所述实景地图中获取若干个所述全景照片,并确定每个所述实景照片的地理位置;
对若干个所述全景照片进行反扭曲变换,得到若干组长宽比相同的平面投影照片;
按照与所述全景照片的对应关系,为每组所述平面投影照片标记地理标记;所述地理标记包括地理位置和具体朝向;
将标记了地理标记的平面投影照片作为训练样本;
利用所述训练样本对所述神经网络模型进行训练,将训练好的所述神经网络模型确定为所述定位模型。
优选地,所述对若干个所述全景照片进行反扭曲变换,得到若干组长宽比相同的平面投影照片,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蜂图科技有限公司,未经蜂图科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080001067.0/2.html,转载请声明来源钻瓜专利网。