[发明专利]一种基于支持向量机的水下目标视觉识别分类方法在审
申请号: | 202011635352.6 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112733914A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 刘彦呈;朱鹏莅;陈瀚;董张伟;刘厶源;于春来;郭昊昊;陈洋 | 申请(专利权)人: | 大连海事大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 姜玉蓉;李洪福 |
地址: | 116026 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 支持 向量 水下 目标 视觉 识别 分类 方法 | ||
1.一种基于支持向量机的水下目标视觉识别分类方法,其特征在于包括:
对拍摄到的原始水下图像进行图像预处理,包括将图像的多维度环境特征转换到HSV颜色空间进行去背景处理、解算得到包含目标的二值化图像;
将二值化图像映射到原始水下图像中进行剪裁处理获得目标图像;
提取目标物图像的HOG特征信息,通过计算和统计图像局部区域的梯度方向直方图从而构造HOG特征信息;
以目标物和障碍物为标签信息基于HOG特征信息训练优化支持向量机,寻求最优分类方式从而对目标物和障碍物进行分类处理;
采用水下航行器进行实验,通过真实环境实验和仿真分析验证所提出的基于支持向量机的水下目标视觉识别分类方法的有效性和稳定性。
2.根据权利要求1所述的方法,其特征还在于:将拍摄到的多维度水下环境特征转换到HSV颜色空间进行去背景处理:
设(r,g,b)分别为水下图像颜色的红、绿和蓝坐标,设max为(r,g,b)中的最大者,设min为(r,g,b)中的最小者,计算在HSV空间中的(h,s,v)值,其中h∈[0,360)为角度的色相角,s,v∈[0,1)为饱和度和亮度,采用多维度环境特征空间转换方式将RGB图像转换为HSV图像,对图像进行过滤背景处理,在阈值化处理和图像合成阶段,对HSV三通道图像分别设置对应颜色上限阈值和下限阈值,经过上下限滤波得到HSV的三个单通道图像,通过运算合并三通道图像、获得包含目标的二值化图像;在包含目标的二值化图像中提取目标的轮廓信息,根据轮廓信息得到绘制轮廓的点在x方向上和在y方向上的最大值xmax、ymax和最小值xmin,ymin,根据(xmax,ymin),(xmax,ymax),(xmin,ymin),(xmin,ymax)四个点坐标在水下航行器所拍摄的RGB图像截取对应的矩形区域。
3.根据权利要求1所述的方法,其特征还在于:以包含目标物的图像为正样本信息、包含障碍物的图像为负样本信息,对正负样本提取HOG特征信息,通过计算和统计图像局部区域的梯度方向直方图构成HOG特征,将图像分成多个单元格细胞,采集其中各像素点的梯度或边缘方向直方图并组合构成特征描述器,具体方式为:
采用[-1,0,1]梯度算子对原图像做卷积运算得到x方向的梯度分量,采用[1,0,-1]T梯度算子对原图像做卷积运算,得到y方向的梯度分量;
采用以下公式计算该像素点的梯度大小和方向,图像中像素点(x,y)的梯度为:
Gx(x,y)=H(x+1,y)-H(x-1,y) (4)
Gy(x,y)=H(x,y+1)-H(x,y-1) (5)
其中,Gx(x,y),Gy(x,y),H(x,y)分别表示输入图像中像素点(x,y)处的水平方向梯度、垂直方向梯度和像素值,像素点(x,y)处的梯度幅值和梯度方向分别为
将图像分成若干个单元格细胞,每个单元格细胞为8×8个像素,将单元格细胞的梯度方向360度分成9个方向块来统计该8×8个像素的梯度信息,即zn=[20(n-1),20n),[180+20(n-1),180+20n)|n∈[1,9),如果像素的梯度方向α(x,y)∈zn,则在直方图第n个方向块的统计中加上1×G(x,y);
在每个单元格细胞里,对所有像素的各个梯度方向区间进行直方图统计,得到9维的特征向量,每相邻的4个单元格细胞构成一个块,每个块的尺寸为16×16,把一个块内的特征向量联起来得到64维的特征向量,用块对样本图像进行扫描,扫描步长为一个单元,步长设置为8×8,最后将所有块的特征串联得到目标的HOG特征。
4.根据权利要求1所述的方法,其特征还在于:将目标物的HOG特征x1,x2,x3,…,xn和障碍物的HOG特征xn+1,xn+2,xn+3,…,xm分别带入到分类超平面f(xi)=wTxi+b,使其满足:
式中,wT∈H超平面法向量,H表示内积空间,b∈R表示偏移量,yi表示类别,当yi=1时标签为目标物,当yi=-1标签为障碍物,在约束条件yi(wTxi+b)≥1,i=1,2,…,m下,已有训练样本集中求解
引入引入拉格朗日函数:
α=α1,α2,…,αn为拉格朗日乘子向量,通过对其对偶问题的求解求得最优的超平面参数为和b*,最后得到最优分类超平面函数为
通过将图像的HOG特征带入到最优分类超平面函数,若结果为正,则为目标物,反之则为障碍物,最后将识别结果映射到二值图像中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学,未经大连海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011635352.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:号角单元、号角组阵装置及发声装置
- 下一篇:一种单稳态旋钮换挡装置