[发明专利]一种基于深度学习的船名字符区域检测方法有效
申请号: | 201910950738.7 | 申请日: | 2019-10-08 |
公开(公告)号: | CN110766002B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 张三元;吴书楷;祁忠琪;涂凯 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/26;G06N3/04;G06N3/08;G06T7/13;G06T7/136 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 船名 字符 区域 检测 方法 | ||
1.一种基于深度学习的船名字符区域检测方法,其特征在于:
包括以下步骤:
1)采集经过运河的货船图片作为样本图片,然后对样本图片进行预处理,所有样本图片及其标注信息作为数据集;
2)构建船名字符区域检测网络,使用步骤1)的数据集训练船名字符区域检测网络,得到训练后的船名字符区域检测网络;
3)对待测货船图片进行预处理后输入步骤2)训练后的船名字符区域检测网络,获得包含置信度得分的目标框;
4)根据置信度阈值筛选出高得分的目标框,然后通过非极大值抑制算法剔除位置重合度高的目标框,最终保留的目标框作为最终检测结果;
所述步骤2)具体为:
2.1)构建包括输入层、特征提取模块、特征融合模块、预测模块和输出层的船名字符区域检测网络;
特征提取模块包括基础网络模块和三个卷积模块,输入层依次经基础网络模块、第一个卷积模块、第二个卷积模块连接到第三个卷积模块,基础网络模块为去除全连接层后的VGG16网络,每个卷积模块均包括两个依次连接的卷积层;
特征融合模块包括四个依次连接的子单元,每个子单元包括依次连接的一个反卷积层、一个Eltwise层和一个卷积层,卷积层作为每个子单元的输出;第二个子单元、第三个子单元和第四个子单元中反卷积层的输入分别为上一个子单元的输出,第一个子单元中反卷积层的输入为第三个卷积模块中第二个卷积层的输出;基础网络模块中的卷积层和池化层分别输入第四个子单元和第三个子单元中的Eltwise层,第一个卷积模块和第二个卷积模块中的第二个卷积层分别输入第二个子单元和第一个子单元中的Eltwise层;
预测模块包括五个预测单元,每个预测单元的输出均连接至输出层,第二个、第三个、第四个和第五个预测单元的输入分别为第一个、第二个、第三个和第四个子单元中卷积层的输出;
2.2)将步骤1)的数据集送入船名字符区域检测网络,采用随机梯度下降法训练神经网络,直到网络的误差达到最小值;其中,前20K次迭代学习率设置为1×10-4,后10K次迭代学习率衰减为1×10-5。
2.根据权利要求1所述的一种基于深度学习的船名字符区域检测方法,其特征在于:所述步骤1)和步骤4)中的预处理为将图片缩放至500×500的固定尺寸。
3.根据权利要求1所述的一种基于深度学习的船名字符区域检测方法,其特征在于:所述步骤1)具体为:对样本图片进行预处理后使用标注软件对船名字符区域的位置进行矩形框框定标注,并赋予船名字符区域标签序号1,赋予船名字符区域以外的背景区域标签序号0;所有样本图片及其标注信息作为数据集,标注信息包括标签序号和矩形框的位置信息,矩形框的位置信息为矩形框左上角的坐标值以及矩形框的宽度值和长度值。
4.根据权利要求1所述的一种基于深度学习的船名字符区域检测方法,其特征在于:船名字符区域检测网络中高层次的特征图经过子单元中反卷积层的反卷积操作后与网络中低层次的特征图大小一致;
所述子单元的Eltwise层用于将输入的两个特征图中相同位置的像素值相加。
5.根据权利要求1所述的一种基于深度学习的船名字符区域检测方法,其特征在于:特征图经过预测单元生成多个以特征图中每个像素点为中心的默认包围框,所述默认包围框为一系列面积相同纵横比不同的矩形框,矩形框的纵横比分别为1、1/2、1/3、1/5、1/7和1/10;
对于每个矩形框,预测单元采用两个1×5大小卷积核的卷积层分别进行类别得分和位置偏移的计算,所述类别得分为矩形框内船名字符区域的置信度得分,所述位置偏移为船名字符区域位置的计算,计算结果包括矩形框左上角的坐标值以及矩形框的宽度值和长度值。
6.根据权利要求1所述的一种基于深度学习的船名字符区域检测方法,其特征在于:所述的步骤4)中,每张图片输入船名字符区域检测网络后输出大量重复的矩形框,首先根据预设的置信度阈值选出高得分的矩形框,然后利用非极大值抑制算法剔除冗余的矩形框,保留船名字符区域邻域里置信度得分最高的矩形框,最终保留的矩形框作为最终检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910950738.7/1.html,转载请声明来源钻瓜专利网。