[发明专利]一种基于卷积神经网络的船舶吃水线提取方法在审
申请号: | 201910135853.9 | 申请日: | 2019-02-25 |
公开(公告)号: | CN109903303A | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 李雅倩;薛银涛;李海滨;杜雨杭;贾璐;苏青 | 申请(专利权)人: | 秦皇岛燕大滨沅科技发展有限公司 |
主分类号: | G06T7/13 | 分类号: | G06T7/13;G06T7/12;G06N3/04 |
代理公司: | 石家庄知住优创知识产权代理事务所(普通合伙) 13131 | 代理人: | 林艳艳 |
地址: | 066000 河北省秦皇岛市经济技术*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 船舶吃水 吃水线 视频 计量技术领域 读取 电磁吸附式 爬壁机器人 二值分割 复杂环境 港口船舶 港口散货 结果图片 精度问题 模型参数 水平投影 水线位置 学习训练 训练学习 有效解决 准确问题 鲁棒性 数据集 准确率 六面 履带 水线 摄像机 采集 船舶 拍摄 学习 制作 网络 | ||
1.一种基于卷积神经网络的船舶吃水线提取方法,其特征在于:
利用摄像机采集船舶的左右舷艏、舷舯、舷艉六面水尺视频;然后统一对水线以上标注为船体,水线以下标注为水体,制作出大量的标注图;然后建立深度学习图像语义分割模型,利用标注图对模型进行训练以确定模型参数;然后利用深度学习图像语义分割模型获取船舶吃水线;
所述深度学习图像语义分割模型由七个块构成,前五个Block卷积核统一采用3*3,Block1由64通道的两个卷积层组成,Block2为先进行池化层池化下采样操作,再由两个128通道的卷积层组成,Block3、Block4和Block5均为先进行池化层,再由三个通道数分别是256,512,512的卷积层组成;前五个Block都是VGGNet16的网络结构,并由训练好的VGG16网络模型参数进行初始化,Block6由下采样层和卷积核大小为7*7,通道数为4096的卷积层以及两个卷积核大小为1*1,通道数为4096的卷积层组成,Block7为反卷积层,将Block6输出采用双线性插值上采样成与输入原图大小一致。
2.根据权利要求1所述的一种基于卷积神经网络的船舶吃水线提取方法,其特征在于:其具体步骤如下:
(1)视频数据采集:使用搭载摄像头的爬壁机器人采集船舶的左右舷艏、舷舯、舷艉六面水尺视频,每个视频时长为2-4分钟;采集不重复的包含各种环境条件下的目标视频不少于20个,作为训练视频;采集目标视频以获取船舶的吃水深度;
(2)深度学习数据集:对步骤(1)中的训练视频进行标注制作大量的标注图;统一对水线以上标注为船体,水线以下标注为水体;
(3)深度学习图像语义分割模型的建立:
深度学习图像语义分割模型由七个块构成,前五个Block卷积核统一采用3*3,Block1由64通道的两个卷积层组成,Block2为先进行池化层池化下采样操作,再由两个128通道的卷积层组成,Block3、Block4和Block5均为先进行池化层,再由三个通道数分别是256,512,512的卷积层组成;前五个Block都是VGGNet16的网络结构,并由训练好的VGG16网络模型参数进行初始化,Block6由下采样层和卷积核大小为7*7,通道数为4096的卷积层以及两个卷积核大小为1*1,通道数为4096的卷积层组成,Block7为反卷积层,将Block6输出采用双线性插值上采样成与输入原图大小一致;
(4)模型训练:使用步骤(3)中的深度学习图像语义分割模型,对步骤(2)中的标注图进行图像特征提取;确定深度学习图像语义分割模型参数;
(5)船舶吃水线提取:
将步骤(1)中采集到的目标视频每一帧输入到步骤(4)训练后的模型,得到二值分割结果图片,进行水平投影,获取水线位置。
3.根据权利要求2所述的一种基于卷积神经网络的船舶吃水线提取方法,其特征在于:每个训练视频制作400-600张标注图,标注图的制作采用VOC2012深度学习语义分割数据集的制作方式。
4.根据权利要求2所述的一种基于卷积神经网络的船舶吃水线提取方法,其特征在于:所述深度学习图像语义分割模型的深度学习环境搭建如下:配置两个环境,一是基于linux系统的深度学习环境,用于训练得到深度学习图像语义分割模型参数;二是深度学习模型移植到windows系统实现船舶吃水线提取的工程项目环境。
5.根据权利要求2所述的一种基于卷积神经网络的船舶吃水线提取方法,其特征在于:所述步骤(5)船舶吃水线提取的具体步骤为:将步骤(1)中的目标视频第一帧中以水线为中心,选取大小为224*224的图片ROI,利用步骤(4)训练后的模型,获得二值分割图像,通过水平投影,即水平遍历像素值,当第r行出现前景像素占比大于50%,且第r+2行占比大于70%,第r+4行占比大于80%,则r为吃水线位置;获取水线在图像中的位置;通过前后两帧水线位置的变化,更新ROI;以船舶标准字符为参考,计算图像坐标和世界坐标的转化关系,得到每一帧吃水线的实际高度;求取时间段内的平均值,作为最终的船舶吃水线高度。
6.根据权利要求5所述的一种基于卷积神经网络的船舶吃水线提取方法,其特征在于:二值分割图像通过canny边缘检测算法或其他边缘检测算法得到吃水线位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于秦皇岛燕大滨沅科技发展有限公司,未经秦皇岛燕大滨沅科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910135853.9/1.html,转载请声明来源钻瓜专利网。