[发明专利]一种基于YOLOv3的视频目标检测方法在审
申请号: | 201910548173.X | 申请日: | 2019-06-24 |
公开(公告)号: | CN110363100A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 刘辉;杨旭 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T7/246;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频目标 网络单元 卷积 检测 计算机视觉技术 卷积神经网络 标签分类 传统检测 检测问题 目标检测 使用检测 手工特征 输入图像 特征替代 特征网络 特征选择 提取特征 图像定义 中心坐标 特征图 小目标 预测 视觉 融合 学习 | ||
1.一种基于YOLOv3的视频目标检测方法,其特征在于:
Step1:定义视频视觉任务;
Step2:通过特征网络对输入图像提取特征,得到一定尺寸的特征图;
Step3:通过groundtruth中的物体中心坐标在那个网络单元中,接着由该网络单元来预测该物体;
Step4、利用边界框中和groundtruth的IOU最大的边界框来预测该物体。
2.根据权利要求1所述的基于YOLOv3的视频目标检测方法,其特征在于:所述步骤step2中图像采用448*448,特征网络采用Darknet-53架构,Darknet-53包含卷积层,池化层,Softmax层,采用全卷积,引入residul结构,采用Softmax分类器做训练,学习率0.001,批量大小为64,为采用批量标准化对权重参数和偏置参数进行迭代训练,设置权重衰减速率weight_decay默认为0.0001,动力为0.9,批量标准化的衰减速率默认为0.997,池化层采用平均池化方式,同时将最大池化的Padding的模式设为SAME,迭代测试40200次。
3.根据权利要求1所述的基于YOLOv3的视频目标检测方法,其特征在于:所述步骤step3中采用跨尺度的预测,YOLOv3有三个尺度预测边界框,使用特征提取模型通过FPN网络上进行改变,YOLOv3使用K-Means聚类来得到边界框,选择9个簇以及3个尺度,然后将这9个簇均匀的分布在这几个尺度上。
4.根据权利要求1所述的基于YOLOv3的视频目标检测方法,其特征在于:所述步骤step4中每个通过边界框回归预测一个物体的得分,如果预测的这个边界框与真实的边框值重合度超过一半且优于其他所有预测,那么这个值就为1;如果overlap没有达到设定的阈值,那么这个预测的边界框显示为没有损失值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910548173.X/1.html,转载请声明来源钻瓜专利网。