[发明专利]基于单目视觉的地面T形运动目标检测与定位方法在审
申请号: | 201810520560.8 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108765444A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 侯谊;贺风华;姚郁;马杰;郝宁 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06T7/136 | 分类号: | G06T7/136;G06T7/246;G06T7/70;G06K9/62 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运动目标检测 单目视觉 二值图 分类器 地面移动目标 颜色空间变换 摄像头采集 位置和方向 高度信息 目标检测 区域提取 特征输入 图片生成 图像分割 形状分析 坐标变换 负样本 正样本 飞行器 旋翼 图片 相机 采集 检测 | ||
1.基于单目视觉的地面T形运动目标检测与定位方法,其特征在于,包括以下步骤:
步骤一、采集一定数量的正样本和负样本,对采集的样本提取HOG特征,并赋予标签,将特征与标签送入SVM中进行训练,保存训练得到的分类器;
步骤二、输入无人机上摄像头采集的图片,与无人机固连的摄像头正下视以获得摄像头距地高度,根据已知的目标距地高度求得相机距目标的距离;
根据已知的目标实际空间中的大小lx*ly和摄像机的高度h,以及定焦距相机的fx,fy,求出目标在图像中的大小,目标在图像x轴,y轴上的像素数为:
之后用预定大小的窗口截取图片的区域;
fx表示定焦距相机的x轴上的焦距,单位是像素;fy表示定焦距相机的y轴上的焦距,单位是像素;
步骤三、对步骤二中截取图片的区域提取HOG特征,将特征输入步骤一生成的分类器中,分类器输出该区域是否为目标;
步骤四、对于是目标的区域,进行颜色空间变换,根据颜色信息,进行基于阈值的图像分割,生成二值图,将T型板与背景分离;
步骤五、根据二值图中的分割结果,进行矩形拟合,将T型板用矩形确定出来,根据拟合矩形的长短边信息,获取目标的准确位置和可能的方向,并根据矩形区域四个角的颜色信息,判断出T型板的准确方向;
步骤六、根据步骤三确定的目标在图像中的位置,求解目标相对于飞行器的位置;将摄像头固连于飞行器,所以摄像头的姿态信息和高度信息可根据飞行器的姿态和高度获得,根据相机成型模型和旋转变换关系,可求得目标与飞行器的相对位置关系。
2.根据权利要求1所述的基于单目视觉的地面T形运动目标检测与定位方法,其特征在于,步骤一包括以下步骤:
步骤一A、采集一定数量的正样本和负样本,对采集的样本提取HOG特征,并赋予标签;
采集不同角度不同光照情况下的目标图片,使用截图工具截取包含完整目标的正方形区域,其中,目标在图中所占百分比大于60%,将这些图片赋予标签值1,是为正样本;采集不包含目标的图片,将这些图片赋予标签值-1,是为负样本;正样本与负样本的比例为1:3;将所有图片的调整到同样大小;
步骤一B、对图片提取HOG特征,过程如下:采用Gamma校正法对输入图像进行颜色空间的标准化;之后计算图像中每个像素水平方向和垂直方向的梯度值dx与dy,并计算梯度的方向θ:
dx(x,y)=I(x+1,y)-I(x-1,y)
dy(x,y)=I(x,y+1)-I(x,y-1)
式中,I(x,y)为图像中坐标为(x,y)的像素点的灰度值;
将图片分为n*n个单元格,每个区域包含m*m个像素;生成单元格的梯度特征直方图,将梯度方向分为k个区间,将这些区间作为直方图的横轴,每个区间的值为该属于该区间的像素梯度值之和,统计单元格内每个区间的值,为直方图的纵轴,则每个单元格包含k个特征值;将j*j个单元格的特征串联到一起,j<n,生成一个块B,对块内的特征向量进行归一化,生成j*j*k个特征向量;按照预设步长移动扫描图片的块特征,步长为一个或多个单元格,统计所有块的特征,即为最终的HOG特征;
步骤一C、训练分类器:将步骤一A产生的图片标签与步骤一B生成的图片特征向量输入到SVM分类器中进行训练,生成用于分类的分类器。
3.根据权利要求1所述的基于单目视觉的地面T形运动目标检测与定位方法,其特征在于,在步骤二中:
将目标在图像中的边长大小设定w=min(nx,ny),估计目标在图像中的边长大小为w/2到2*w之间;
截取图片区域的流程如下:首先,将检测窗口的大小设定目标边长的w/2,按照一定的步长在输入图像上移动检测窗口,一般情况下,步长可设定为检测窗口边长的1/2或1/4,将每一次窗口截取到的区域保存下来,直到检测窗口对输入图像全图都进行过截取;然后,将检测窗口放大到一定的倍数,倍数可设定为1.1倍,继续按照一定的步长移动,直到遍历完全图;不断放大检测窗口,截取图片区域,直到检测窗口边长大于估计的目标最大边长,即为w*2,停止截取图片,将所有截取的区域保存下来。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810520560.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自适应颜色阈值分割的标志增强处理方法
- 下一篇:一种肺气管分割方法及装置