[发明专利]一种基于卷积神经网络的海底底质声呐图像分类方法有效
申请号: | 201810864966.8 | 申请日: | 2018-08-01 |
公开(公告)号: | CN109086824B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 赵玉新;付楠;刘厂;赵廷;万宏俊;董静;张卫柱;朱可心 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06K9/46 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 姜荣丽 |
地址: | 150001 黑龙江省*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 海底 底质 声呐 图像 分类 方法 | ||
1.一种基于卷积神经网络的海底底质声呐图像分类方法,所述方法具体包括步骤:
步骤一、获取N张第一海底底质声呐图像,所述的N张第一海底底质声呐图像构成海底底质声呐图像集,分别对每张所获取的第一海底底质声呐图像进行分割,获取具有单一海底底质情况的第二海底底质声呐图像;
首先利用多波束、侧扫声呐探测系统对海底底质情况进行探测获取N张第一海底底质声呐图像,所述N张第一海底底质声呐图像构成海底底质声呐图像集,N大于1000,对每张第一海底底质声呐图像进行分割,获取具有单一海底底质情况的第二海底底质声呐图像,分割后所得的每张第二海底底质声呐图像的大小均相等,且每张大小均至少为50*50像素,所述海底底质情况的类别为基岩、砾石、砂、细砂和泥;
步骤二、分别对每张第二海底底质声呐图像进行预处理,获取第三海底底质声呐图像;
所述预处理具体包括:
首先分别对每张第二海底底质声呐图像进行平滑去噪和特征增强的处理;
然后利用小波变换技术对经过平滑去噪和特征增强的海底底质声呐图像进行滤波;
最后利用多级中值滤波方法对经过滤波后的海底底质声呐图像进行加强处理,获取第三海底底质声呐图像;
步骤三、基于Canny边缘检测算法分别对每张第三海底底质声呐图像的边缘形状信息进行检测和提取,获取相应的第一边缘图像,每张第一边缘图像均具有一种边缘形状信息,所述第一边缘图像均为01二值化图像,将所述第一边缘图像与第三海底底质声呐图像进行对比,分别将每张第一边缘图像中的1值替换为第三海底底质声呐图像对应位置的灰度值,获取第二边缘图像;所述Canny边缘检测算法设定的提取阈值取0.5;
步骤四、根据每张第二边缘图像的边缘形状信息和灰度值,计算生成相应的灰度-基元共生矩阵,再分别将每个灰度-基元共生矩阵转化为相应的灰度图;
步骤五、由灰度图构成的灰度图像集构建卷积神经网络输入样本集,并将所述卷积神经网络输入样本集分为训练集、验证集和测试集;
步骤六、构建卷积神经网络分类器结构;
步骤七、将所述训练集和验证集分别作为所述卷积神经网络分类器结构的输入,分别训练和验证所述卷积神经网络分类器结构,获得分类模型;
所述训练集和第二海底底质声呐图像中各种海底底质情况的类别数目比例一致,所述的训练集和验证集中的样本比例为4:1,测试集样本数量为50;
步骤八、根据所述分类模型对测试集进行分类识别;
其特征在于:
步骤四具体为:分别扩展第二边缘图像,将第二边缘图像转化为矩阵,并分别将每个矩阵的四周各增加一行或一列的0元素,然后将每张第二边缘图像中的各个像素灰度值均由各个像素灰度值周围4邻域像素灰度值之和进行替换,即计算每个像素的周围4邻域像素灰度值对该像素的矩,将矩值为最小纹理基元;分别求得每个像素对应的最小纹理基元后,将所有求得的最小纹理单元形成基元阵,所述基元阵和对应的第二边缘图像共同构建灰度-基元共生矩阵,分别将每个灰度-基元共生矩阵转化为相应的灰度图;
步骤六具体为:
构建一个卷积神经网络分类器结构,所述的卷积神经网络分类器结构为八层卷积神经网络结构,所述八层卷积神经网络分类器结构包括输入层Input、第一卷积层C1、第一最大池化层S2、第二卷积层C3、第二最大池化层S4、第一全连接层D5、第二全连接层D6和输出层Output;
C1是第一卷积层,由于是4个滤波器,因此包含了4个特征图,每个特征图代表学到的一组特征,所述特征包括垂直边缘特征、水平边缘特征以及扇形边缘特征;从第一卷积层C1到第一最大池化层S2的过程是一个下采样过程,即池化过程,最大池化保留了每一个小块内的最大值,所以它相当于保留了这一块最佳的匹配结果;具体做法是在第一卷积层C1中的连续4个2×2区域像素选取其中最大值映射到第一最大池化层S2中的一个点上,第一卷积层C1中的每一个特征图都单独下采样,因此第一最大池化层S2也包含4个特征图;第一卷积层C1卷积和第一最大池化层S2池化的具体连接过程为,Input是输入层,在此输入待识别图像,W是滤波器,也是权重大小,b为偏置,待识别图像依次通过W和b后通过ReLU激活函数得到第一卷积层C1的特征图,以得到第一卷积层C1的特征图为例,其计算公式
其中表示第一卷积层C1中第l个特征图的第j个神经元,表示与相连的输入层的点,表示第一卷积层C1中的点与输入层连接点的权重,即是卷积核的值,表示偏置,函数f为激活函数ReLU,i和j的取值均为1-2500;第一卷积层C1中的特征图总个数为4到32,这里选定第一卷积层C1中共有4个特征图,因此l的取值范围为1-4,神经元个数取决于八层卷积神经网络分类器结构输入的待识别图像大小和滤波器大小;其中激活函数ReLU对于输入的负值,输出全为0,对于正值,原样输出,用于线性变换的输出,易于使用梯度下降训练,加快训练速度;
然后从第一最大池化层S2到第二卷积层C3又是卷积滤波,从第二卷积层C3到第二最大池化层S4是下采样,得到第二最大池化层S4后,将特征拉成一条直线,并对第二最大池化层S4的特征进行全连接方式的卷积,得到为1*64维矩阵,即让每个像素点都为64个特征中每一个特征进行投票,得到第一全连接层D5,之后第一全连接层D5到第二全连接层D6又是全连接,并做softmax操作得到每个类别的概率,得到1*5维矩阵,输出的每一维都是第一海底底质声呐图像属于该类别的概率,最后是输出层Output,输出第一海底底质声呐图像所属类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810864966.8/1.html,转载请声明来源钻瓜专利网。