[发明专利]一种基于SSD的视觉室内定位系统技术方法在审
申请号: | 202110036015.3 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112880681A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 李冀;秦子钦;罗笑南 | 申请(专利权)人: | 桂林慧谷人工智能产业技术研究院 |
主分类号: | G01C21/20 | 分类号: | G01C21/20 |
代理公司: | 北京保识知识产权代理事务所(普通合伙) 11874 | 代理人: | 汪浩 |
地址: | 541200 广西壮族自治区桂*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ssd 视觉 室内 定位 系统 技术 方法 | ||
1.一种基于SSD的视觉室内定位系统技术方法,其特征在于,包括如下步骤:
1)收集站点(商场、博物馆)中的每个地标的图像,并使用地标ID手动注释图像中每个地标的边界框。使用这些图像与标记构建地标数据库;
2)使用图像对这些图像进行大小调整,投影变换,亮度调节和图像模糊来扩充数据库,生成更多训练的图像,防止过度拟合;
3)改善SSD网络使他更快更准确的识别地标;
4)将数据库里的数据输入网络进行训练;
5)手机拍摄视频将视频信息传入服务器中;
6)服务器收集到手机端拍摄的图像后使用基于ROI跟踪的有效关键帧选择方法对潜在的地标、边界和关键帧进行选择,采用改进的SSD来检测地标,得到地标概率;
7)服务器处理相关数据估计位置,并将位置信息发送给手机端。
2.根据权利要求1所述的一种基于SSD的视觉室内定位系统技术方法,其特征在于,步骤2)中,使用图像对这些图像进行大小调整,投影变换,亮度调节和图像模糊来扩充数据库,生成更多训练的图像,防止过度拟合;其中亮度调节使用对比度拉伸,图像模糊使用高斯模糊。
使用设置需要调节到的最大最小像素值使用对比度拉伸进行亮度调节,对比度拉伸对比度拉拉伸公式如下:
其中Imax、Imin是原始图像的最小值和最大值,MAX、MIN是要拉伸到的最大值和最小值。
使用高斯函数求出权重再进行卷积计算来模糊图像,高斯方程如下:
其中r为模糊半径,N表示N维空间。
3.根据权利要求1所述的一种基于SSD的视觉室内定位系统技术方法,其特征在于,步骤4)中,数据库里的数据输入网络进行训练。其具体步骤如下:
a)在训练阶段,一个产生室内场地中K个地标的概率和所有背景类,另一个产生边界框回归偏移量的编码。
b)使用检测跟踪策略来监视视频中的ROI,而不是逐帧检测它们。首先在起始帧(不一定是第一帧)中选择ROI。然后采用核相关过滤器(KCF)来有效跟踪以下帧(每秒约172帧)中每个检测到的ROI。当跟踪的ROI移出视图时,针对每个特定的ROI的跟踪都会停止。然后,我们将每个跟踪中的这些跟踪的ROI分组在一起。这些跟踪的ROI称为ROI序列。生成ROI序列后,将SSD作为另一个起始帧在下一帧中初始化ROI,然后采用过滤器(KCF)跟踪,如图3所示。这样,我们就可以提取ROI,并在ROI中选择那些帧。
c)当SSD检测到具有潜在地标的ROI时,它还会输出每个ROI属于特定地标的可能性。选取可能性最大的地标。
4.根据权利要求1所述的一种基于SSD的视觉室内定位系统技术方法,其特征在于,步骤7)中,位置估计公式,其具体步骤如下:
给定视频中检测到的两个关键帧,两个地标(z1,z2)的坐标以及用户面对它们时的指南针读数(θ1和θ2)连接地标qs和用户位置的直线表示为ls:Asx+Bsx+Cs=0。指南针读数是用户方位与北之间的相对角度(如图3)。我们计算As,Bs与Cs如下:
其中Rs是传递到ls的方向向量的旋转矩阵:
x12确定的客户位置定义如下:
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林慧谷人工智能产业技术研究院,未经桂林慧谷人工智能产业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110036015.3/1.html,转载请声明来源钻瓜专利网。