[发明专利]一种基于卷积神经网络和MAML算法的类圆目标检测方法在审
申请号: | 202111001354.4 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113673621A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 张盛平;郭佳宇 | 申请(专利权)人: | 哈尔滨工业大学(威海) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 264209 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 maml 算法 目标 检测 方法 | ||
本发明公开了一种基于卷积神经网络和MAML算法的类圆目标检测方法,包括以下步骤:首先,收集并标注类圆目标图像数据集;划分收集的数据集以便进行不同的子任务;将训练集中的图像进行数据增强;分别使用大目标检测数据集BO、小目标检测数据集SO、高分辨率检测数据集HR、低分辨率检测数据集LR训练大目标检测模型、小目标检测模型、高分辨率检测模型、低分辨率检测模型;使用MAML算法学习到最有潜力的类圆检测模型;将不同的测试样本送入训练好的模型中进行推理得出检测结果。
技术领域
本发明涉及计算机视觉和模式识别技术领域,尤其是一种基于卷积神经网络和MAML算法的类圆目标检测方法。
背景技术
目标检测是计算机视觉领域的一个重要研究方向,其中类圆目标检测可以推动球类比赛裁决,人脸追踪等任务的快速发展。目前,随着神经网络在计算机视觉领域的广泛应用,基于卷积神经网络的目标检测方法也随之出现。不过,现有的大部分目标检测方法使用的均是可旋转的矩形框作为目标检测的标注方式,对于每个目标都会生成大量候选框,每个候选框将至少包括中心位置,宽高,旋转角度5个参数,这也就导致计算量非常大,因此耗费大量的计算资源。当然在现实场景中,大量的类圆目标需要进行检测,比如各种体育运动中的球,人脸等目标。因此,本文提出了类圆目标的目标检测算法,目的是减少此类目标检测过程中的计算量,并且提高类圆目标检测任务的精确度,促进类圆目标追踪和分割任务的快速发展。
发明内容
本发明的目的是提供一种基于卷积神经网络和MAML算法的类圆目标检测方法,通过改变类圆目标的标注方式,由矩形框的中心位置,宽高,旋转角度5个参数减少为圆形框的圆心位置,半径三个参数,大大降低了模型训练时的计算量;通过使用MAML算法强大的多任务学习能力,增强了模型对不同尺度和不同分辨率图像中目标的检测能力。
为实现上述目的,本发明采用下述技术方案:
一种基于卷积神经网络和MAML算法的类圆目标检测方法,包括以下步骤:
收集并标注类圆目标图像数据集;
划分收集的数据集以便进行不同的子任务;
将训练集中的图像进行数据增强;
分别使用大目标检测数据集BO、小目标检测数据集SO、高分辨率检测数据集HR、低分辨率检测数据集LR训练大目标检测模型、小目标检测模型、高分辨率检测模型、低分辨率检测模型;
使用MAML算法学习到最有潜力的类圆检测模型;
将不同的测试样本送入训练好的模型中进行推理得出检测结果。
进一步地,所述为收集并标注类圆目标图像数据集,包括:
通过不同途径收集具有类圆目标的各类图片若干张,其中包括各种体育比赛中的球,人脸,车轮等目标。然后,将收集好的图片统一转换为一种图片格式,比如JPEG、PNG等;最后,对转换后的图片数据中的类圆目标使用圆形框进行标注。
进一步地,划分收集的数据集以便进行不同的子任务,包括:
将标注好的数据集分别划分到大目标检测、小目标检测、高分辨率图像、低分辨率图像四个数据集中,并统计不同数据集中的待检测目标种类个数C1、C2、C3、C4,以便分别进行四个不同的类圆目标检测子任务。
进一步地,将不同子任务中的图像进行数据增强,包括:
对原始图像数据进行翻转、饱和度、亮度、对比度调整、仿射变换、弹性变换、CutMix、Mosaic这八种数据增强,以便提高类圆目标检测模型的检测精度。
进一步地,分别使用大目标检测数据集BO、小目标检测数据集SO、高分辨率检测数据集HR、低分辨率检测数据集LR训练大目标检测模型、小目标检测模型、高分辨率检测模型、低分辨率检测模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(威海),未经哈尔滨工业大学(威海)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111001354.4/2.html,转载请声明来源钻瓜专利网。