[发明专利]基于迁移学习的船舶目标识别方法在审
申请号: | 201811633084.7 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109800796A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 肖刚;张星辰;乔丹;赵俊豪;冶平 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据集 船舶目标 迁移 定性 定量评价指标 对比测试 方法生成 分类信息 评估指标 评价指标 数据增强 提取特征 运算效率 真实场景 正负样本 测试集 视频帧 小样本 训练集 坐标点 分类 拟合 学习 运算 绘制 评判 测试 拍摄 优化 | ||
一种基于迁移学习的船舶目标识别方法,首先通过数据增强的方法生成数据集,将数据集进行基于正负样本数目的优化划分得到训练集和测试集,为避免小样本数据集导致的过拟合采用InceptionV3模型以迁移学习的方式对数据集进行训练和测试,以定量评判指标作为定量评价指标,并选取真实场景拍摄的视频帧进行对比测试,通过设定阈值得出的一系列坐标点,绘制定性评估指标ROC曲线,并生成分类信息作为定性评价指标。本发明无需手工提取特征即能实现对船舶目标域的高精度分类、高运算效率的识别,其具有更高的分类召回率且运算速度更快。
技术领域
本发明涉及的是一种图像处理领域的技术,具体是一种基于迁移学习的船舶目标识别方法。
背景技术
随着水上交通的迅速发展,水面路况也越来越复杂。船桥相撞事故的频发,导致河道通航存在着一定的安全隐患,因此对船舶实施有效精准的目标识别是必要的手段措施。目标识别是计算机视觉领域里的一个重要研究方法。传统的实现算法主要是基于人为的特征设计,由于目标的特征往往会受到光照强度、拍摄视角、轮廓纹理等因素的影响,手动提取特征也就存在着缺陷,并且该算子无法有效提取目标的深层表征。
针对传统目标识别算法存在的特征学习问题,不少学者提出了新的研究方法进行改进。2015年梁锦雄等人将BP算法应用在6种类别的船舶分类中,对目标区域进行边缘梯度直方图等的特征提取,最终的分类精度达到84%。之后卷积神经网络的算法也被应用到图像分类中,2017年,戚超等人将八层网络结构的经典模型Alex Net与支持向量机相结合,用SVM分类器替换卷积神经网络的soft max分类器,对船舶数据集进行训练,经测试结果发现平均准确率达到了88.6%。尽管这两种不同的方法在多分类识别任务中都取得了不错的测试精度,但仍有一定的上升空间,并且计算复杂度较高,无法保证运算的快速性。
发明内容
本发明针对现有技术小样本船舶数据集导致的过拟合问题,以及现有算法在分类识别任务中测试精度的不足,提出一种基于迁移学习的船舶目标识别方法,无需手工提取特征即能实现对船舶目标域的高精度分类、高运算效率的识别,与BP算法、Alex Net模型的SVM分类算法和另外一种卷积神经网络Similar Le-Net5的方法相比,InceptionV3模型迁移学习的分类召回率更高且运算速度更快。
本发明是通过以下技术方案实现的:
本发明首先通过数据增强的方法生成数据集,将数据集进行基于正负样本数目的优化划分得到训练集和测试集,为避免小样本数据集导致的过拟合采用InceptionV3模型以迁移学习的方式对数据集进行训练和测试,以定量评判指标作为定量评价指标,并选取真实场景拍摄的视频帧进行对比测试,通过设定阈值得出的一系列坐标点,绘制定性评估指标ROC曲线,并生成分类信息作为定性评价指标。
所述的迁移学习是指:针对小样本数据集导致的过拟合问题,冻结模型部分网络层在大规模源域训练过的权重参数,转移到小规模目标域中并重新训练该模型最后的全连接层,然后将训练之后的参数保存,对船舶测试集进行分类测试。
所述的小规模目标域为船舶数据集。
所述的优化划分是指:样本图片中测试集样本占数据集总样本的1/5,训练集正负样本比例等于测试集正负样本比例,为2:1~2.5:1。
所述的InceptionV3模型,由11个Inception模块组成,每个模块由许多小尺寸的卷积聚合并联组成,使得在相同的感受野中能学习更多的图像特征,减小了计算复杂度也避免了过拟合问题。
所述的迁移学习具体是指:将全连接层之前的网络层作为瓶颈(Bottleneck)层,冻结其所有权重参数,只训练模型的全连接层,具体为:InceptionV3模型采用的目标函数是交叉熵损失函数:其中:y是期望输出值,是真实输出值:当y=1时:当y=0时:当真实输出趋近于期望的输出值y时,损失L均趋近于0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811633084.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种果蔬识别方法及系统
- 下一篇:基于AI的文件黑白判断方法、装置及设备