[发明专利]基于改进YOLO-V3的目标检测系统、方法及终端有效
申请号: | 202010333517.8 | 申请日: | 2020-04-24 |
公开(公告)号: | CN111553406B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 田鹏程 | 申请(专利权)人: | 上海锘科智能科技有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/80;G06V10/766;G06V10/762;G06V10/764;G06V10/52;G06N3/0464;G06N3/08 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 邹成娇 |
地址: | 200120 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 yolo v3 目标 检测 系统 方法 终端 | ||
1.一种基于改进YOLO-V3的目标检测系统,其特征在于,包括:图像获取模块、图像预处理模块、darknet-39主干网络模块、多尺度卷积层特征组合模块、加权特征融合模块和预测模块,
所述图像获取模块用于获取待识别图像;
所述图像预处理模块用于对待识别图像进行预处理,得到预处理后的图像;
所述darknet-39主干网络模块是通过darknet-53主干网络进行改进得到darknet-39主干网络模型,采用darknet-39主干网络模型提取图像特征,得到5个不同尺度卷积层的特征图;
所述多尺度卷积层特征组合模块用于将5个不同尺度卷积层的特征图进行最优组合得到组合特征图;
所述加权特征融合模块用于对组合特征图进行加权特征融合;
所述预测模块用于采用YOLO-V3算法对融合后的特征图进行回归预测,得到目标检测结果;
所述darknet-39主干网络模块包括darknet-39主干网络训练单元,所述darknet-39主干网络训练单元在传统的YOLO-V3算法的主干网络中增加了2个卷积层,采用5个不同尺度卷积层特征图来进行目标检测;
获取数据集,将数据集划分为训练集、测试集和验证集,
在训练集上采用k-means聚类算法重新聚类边界框的坐标,计算出5个不同尺度卷积层特征图的15个边界框坐标。
2.如权利要求1所述的基于改进YOLO-V3的目标检测系统,其特征在于,所述图像预处理模块包括图像旋转单元和缩放单元,所述图像旋转单元用于对待识别图像进行随机水平/垂直翻转、裁剪;所述缩放单元用于对待识别图像进行尺度变换。
3.一种基于改进YOLO-V3的目标检测方法,其特征在于,包括:
获取待识别图像;
对待识别图像进行预处理,得到预处理后的图像;
采用训练好的darknet-39主干网络模型提取图像特征,得到5个不同尺度卷积层的特征图;
将不同尺度卷积层的特征图进行最优组合得到组合特征图;
对组合特征图进行加权特征融合;
采用YOLO-V3算法对融合后的特征图进行回归预测,得到目标检测结果;
还包括训练darknet-39主干网络模型的步骤,所述训练darknet-39主干网络模型的具体方法包括:
在传统的YOLO-V3算法的主干网络中增加了2个卷积层,采用5个不同尺度卷积层特征图来进行目标检测;
获取数据集,将数据集划分为训练集、测试集和验证集,
在训练集上采用k-means聚类算法重新聚类边界框的坐标,计算出5个不同尺度卷积层特征图的15个边界框坐标。
4.如权利要求3所述的基于改进YOLO-V3的目标检测方法,其特征在于,所述对待识别图像进行预处理的具体方法包括:
将待识别图像进行随机水平/垂直翻转、裁剪;
将所述待识别图像进行尺度变换。
5.一种智能终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,其特征在于,所述处理器被配置用于调用所述程序指令,执行如权利要求3-4任一项所述的方法。
6.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求3-4任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海锘科智能科技有限公司,未经上海锘科智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010333517.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体结构及其制造方法
- 下一篇:一种采用多维度融合的多船舶跟踪方法