[发明专利]一种视觉定位方法、装置、设备及可读存储介质在审

申请号：	202080001067.0	申请日：	2020-05-26
公开（公告）号：	CN111758118A	公开（公告）日：	2020-10-09
发明（设计）人：	陈尊裕;吴珏其;胡斯洋;陈欣;吴沛谦;张仲文	申请（专利权）人：	蜂图科技有限公司
主分类号：	G06T7/00	分类号：	G06T7/00;G06N3/08;G06N3/04
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	徐丽
地址：	中国香港荔枝角长沙湾***	国省代码：	香港;81
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视觉定位方法装置设备可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种视觉定位方法、装置、设备及可读存储介质，该方法包括：获取广角照片，并对广角照片进行随机分割，获得待测图集；将待测图集输入至定位模型进行定位识别，得到多个候选定位；定位模型为利用实景地图中的全景照片训练后的神经网络模型；利用多个候选定位，确定出最终定位。在本申请中，基于实景地图中的全景照片对神经网络模型进行训练即可得到一个定位模型，且基于该定位模型可以完成视觉定位，解决了视觉定位训练样本采集困难的问题。

技术领域

本申请涉及定位技术领域，特别是涉及一种视觉定位方法、装置、设备及可读存储介质。

背景技术

基于机器学习的视觉定位原理：利用大量的带有位置标记的真实场景照片进行训练，得到一个输入为照片(RGB数值矩阵)，输出为具体的位置的神经网络模型。获得训练好的神经网络模型后，只需要用户对环境拍摄一张照片就可以得到具体的拍摄位置。

这种方法需要对使用环境采集大量的照片样本作为训练数据集。例如，在一些文献中记载，为了实现对35米宽的街角店铺进行视觉定位，需要采集330张照片，而为了实现对140米的街道(只针对一侧进行定位)进行视觉定位，需采集1500多张照片；为了实现某工厂定位，需将工厂划分为18个区域，每个区域需要拍摄200幅图像。可见，为了保证视觉定位效果，需要采集大量的现场照片作为训练数据，而且这些照片必须保证拍摄到场景中的每个角落，非常耗费时间和人力。

综上所述，如何解决视觉定位中样本采集困难等问题，是目前本领域技术人员急需解决的技术问题。

发明内容

本申请的目的是提供一种视觉定位方法、装置、设备及可读存储介质，利用实景地图中的全景照片来对神经网络模型进行训练，可解决视觉定位中样本采集困难的问题。

为解决上述技术问题，本申请提供如下技术方案：

一种视觉定位方法，包括：

获取广角照片，并对所述广角照片进行随机分割，获得待测图集；

将所述待测图集输入至定位模型进行定位识别，得到多个候选定位；所述定位模型为利用实景地图中的全景照片训练后的神经网络模型；

利用多个所述候选定位，确定出最终定位。

优选地，所述利用多个所述候选定位，确定出最终定位，包括：

对多个所述候选定位进行聚类处理，并利用聚类结果对多个所述候选定位进行筛选；

利用筛选得到的若干候选定位构建几何图形；

将所述几何图形的几何中心作为所述最终定位。