[发明专利]一种基于全卷积神经网络的侧扫声纳图像特征提取方法有效

专利信息
申请号: 201910932848.0 申请日: 2019-09-29
公开(公告)号: CN110781924B 公开(公告)日: 2023-02-14
发明(设计)人: 王宏健;高娜;陈涛;肖瑶;阮力;李本银 申请(专利权)人: 哈尔滨工程大学
主分类号: G06V10/764 分类号: G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 150001 黑龙江省哈尔滨市南岗区*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 卷积 神经网络 声纳 图像 特征 提取 方法
【权利要求书】:

1.一种基于全卷积神经网络的侧扫声纳图像特征提取方法,其特征在于,具体的实现步骤为:

步骤1:利用原有的声纳图像进行数据增广,获得模型训练和测试所需的样本集;对样本集中的每幅图像的海底地形的边缘区域进行人工标注,将目标和背景用不同的类别区分,获得模型训练和测试所需的标签图;

步骤2:构建全卷积神经网络模型,即构建FCNs模型;

所述FCNs模型以VGG16为基础网络,利用与对应全连接层输入数据尺寸相同的卷积核,将VGG16的全连接层转化为三个卷积层,其中最后一层卷积层输出结果为热图,热图个数对应类别个数;FCNs模型在热图之后增加反卷积层,对热图进行上采样以恢复原始图像尺寸;FCNs模型增加跳层结构,通过跳层结构融合浅层与深层的特征信息,获得更加准确的特征输出;步骤3:将海底地形图像及对应的标签图输入FCNs模型,采用带动量项的小批量梯度下降法训练,保存最优的FCNs模型;

FCNs模型的训练过程可以抽象为寻找最佳的参数值使得损失函数值最小;损失函数softmaxwithloss由softmax和loss组成,softmax为:

其中,ak(x)表示在x点上第k类的输出值;表示在x点上所有类的输出值之和;pk(x)表示在x点上第k类的概率;

loss为:

loss=-log pj(x)

pj(x)表示在x点上最大的概率值;

采用冲量项的小批量梯度下降算法优化损失函数;小批量梯度下降算法的核心思想是利用梯度确定参数更新的方向,即在每次迭代中,对每个变量,按照目标函数在该变量梯度的相反方向,更新对应的参数值,通过对目标函数中的参数不断迭代更新,使得目标函数逐渐靠近最小值;每次计算一小部分训练数据的损失函数,根据这一部分数据的平均梯度更新参数;

FCNs模型的训练分为三个阶段,第一阶段为FCN-32s模型的训练;第二阶段为FCN-16s模型的训练,采用第一阶段训练好的FCN-32s模型初始化网络;第三阶段为FCN-8s模型的训练,采用第二阶段训练好的FCN-16s模型初始化网络;

FCNs模型中所有的反卷积层都采用双线性插值的方式进行初始化,中间的反卷积层的参数在网络的训练过程中作为网络的学习参数不断进行更新,最后的反卷积层的参数为固定值,训练过程中不学习;

步骤4:利用训练好的FCNs模型进行声纳图像海底地形边缘轮廓的特征提取并输出特征提取结果。

2.根据权利要求1所述的一种基于全卷积神经网络的侧扫声纳图像特征提取方法,其特征在于,所述步骤1的具体步骤为:

步骤1.1.将原有海底地形图像通过旋转、翻转变化进行扩充;

步骤1.2.模拟实现声纳图像噪声,声纳图像噪声大部分为服从瑞利分布的散斑噪声,模拟实现散斑噪声的公式为

其中a表示噪声强度,b表示光斑大小,U(0,1)代表平均噪声,z代表散斑噪声;

步骤1.3.利用labelme标注图像,将海底地形的轮廓用像素1表示,海底地形的背景用像素0表示,得到标签图。

3.根据权利要求1所述的一种基于全卷积神经网络的侧扫声纳图像特征提取方法,其特征在于,所述步骤2中为使输出的特征图与原图尺寸相同,FCNs模型设计了三种模式,

第一模式FCN-32s:直接对最后一个卷积层的输出结果以双线性插值的方式进行上采样,步长为32,一步将预测大小恢复为原图像大小,这样做导致损失过多的细节信息,结果不够精细,为了解决此问题,引入了跳级连接的策略;

第二模式FCN-16s:首先将最后一层上采样,步长为2,然后和池化层4的预测结合起来,最后再上采样,步长为16,恢复为原图大小,使网络能够更好地预测细节,同时保留高级别的语义信息;

第三模式FCN-8s:首先上采样再结合高层信息,最后再上采样,步长为8,恢复为原图大小,可获得更高的精度。

4.根据权利要求1所述的一种基于全卷积神经网络的侧扫声纳图像特征提取方法,其特征在于,所述步骤3中FCNs模型训练的第一阶段的批量大小设置为8,学习率为1e-10;第二阶段的批量大小设置为16,学习率为1e-12;第三阶段的批量大小设置为8,学习率为1e-14;三个阶段的权值的正则化系数设置为0.0005,动量项的值为0.99,偏置项的学习率为权值的两倍。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910932848.0/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top