[发明专利]基于深度学习的图像检测定位加速方法在审
申请号: | 201811014414.4 | 申请日: | 2018-08-31 |
公开(公告)号: | CN109410279A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 曾昊;华纯阳;戚国庆 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06T7/73 | 分类号: | G06T7/73;G06K9/46;G06K9/62 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标点 图像检测 摄像头 加速操作 人工判断 三维位置 特征提取 二分类 帧图像 坐标点 多维 算法 图像 拍摄 学习 | ||
1.一种基于深度学习的图像检测定位加速方法,其特征在于包括以下步骤:
步骤一、控制飞行器在事先选定的路线上反复飞行,通过其前下摄像头对固定的n个目标点采集不同角度和光照下的图像;
步骤二、利用卷积神经网络判断当前摄像头所得图像中是否存在目标点;
步骤三、利用卷积神经网络对存在目标点的图像进行判断,得出此图像中存在的是哪一个目标点;
步骤四、提取包含目标点的图像中的SIFT特征;
步骤五、利用提取的SIFT特征和相关的目标点图像进行PnP计算,通过平移和旋转以得到当前摄像头即飞行器的位置。
2.如权利要求1所述的图像检测定位加速方法,其特征在于:所述步骤二和步骤三中,选择卷积神经网络作为分类器,将两个分类器设计为级联方式,先将每一帧图像输入到步骤二中的分类器,将其中结果为positive的数据输入到步骤三的N分类器中。
3.如权利要求1或2所述的图像检测定位加速方法,其特征在于:步骤二中,使用卷积神经网络作为分类器,卷积神经网络中的卷积操作如下:
卷积层:
上式是一个l1层到l2层的卷积映射,代表第n-1层输出中第i个channel中二维位置为(i,j)的数值;代表第n-1层到第n层的映射中,生成第l2层数据时,第l1层二维位置为(i,j)的数值的权重;是第n-1层到第n层的映射中,添加在第l2层上的常数偏差;f是自行选择的非线性激活函数;
使用ReLU给模型添加足够的非线性:
ReLU(x)=max(0,x)
使用梯度下降法训练模型:
xt+1=xt-η*g
其中,g是梯度,η为learning rate,使用其来对学习器的学习速度、参数更新的速率进行限定和控制;
在训练完毕之后,进入infer状态,对于每一个输入到网络中的图像输入xi,都将其映射为一个二维向量,对应此时的二分类问题,记此时的输出为(yi1,yi2),则此时对应的类别为:
其中,1对应positive,0对应negative,通过函数g映射得到。
4.如权利要求1或2所述的图像检测定位加速方法,其特征在于:步骤三中,使用卷积神经网络作为分类器,卷积神经网络中的卷积操作如下:
卷积层:
上式是一个l1层到l2层的卷积映射,代表第n-1层输出中第i个channel中二维位置为(i,j)的数值;代表第n-1层到第n层的映射中,生成第l2层数据时,第l1层二维位置为(i,j)的数值的权重;是第n-1层到第n层的映射中,添加在第l2层上的常数偏差;f是自行选择的非线性激活函数;
使用ReLU给模型添加足够的非线性:
ReLU(x)=max(0,x)
使用梯度下降法训练模型:
xt+1=xt-η*g
其中,g是梯度,η为learning rate,使用其来对学习器的学习速度、参数更新的速率进行限定和控制;
网络输出一个N维向量(zi1.,zi2..ziN),其对应目标点为:
5.如权利要求1所述的图像检测定位加速方法,其特征在于:所述步骤五中使用PnP计算得到的结果进行平移和旋转,得到当前摄像头即飞行器的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811014414.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种目标定位方法、装置及系统
- 下一篇:天线工参核查方法和系统