[发明专利]一种基于改进YOLO v3模型的行人检测方法在审
申请号: | 201911257993.X | 申请日: | 2019-12-10 |
公开(公告)号: | CN111046787A | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 陈健;黄德天 | 申请(专利权)人: | 华侨大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 泉州市文华专利代理有限公司 35205 | 代理人: | 陈雪莹 |
地址: | 362000 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolo v3 模型 行人 检测 方法 | ||
本发明提供一种基于改进YOLO v3模型的行人检测方法包括:选取训练样本;对样本进行K‑means值聚类计算,获得新的anchors值,将新的anchors值替换原始YOLO v3模型中的数据集参数;引入inception模块,并将inception模块进行裁剪优化,得到改进后的YOLO v3模型;使用改进后的YOLO v3模型对行人进行检测,得到检测结果;克服原有YOLO v3模型提取的特征过于单一的问题,提高行人检测的精度。
技术领域
本发明涉及一种基于神经网络的行人检测方法,特别是涉及一种基于改进YOLOv3模型的行人检测方法。
背景技术
行人检测是目标检测领域的分支,对于行人检测技术的迫切需求可以从多方面体现,如智慧交通、安防视频监控、自动驾驶技术等。早前由于受到计算机硬件条件的限制,行人检测的形式以图像为主,仅要求检测出图像中是否存在行人。如今,随着微电子技术与计算机技术的飞速发展,对于此项技术不仅要求在简单的背景环境中能够检测到行人,还要求即使外界环境存在较强的干扰因素时也能够准确检测到行人,例如强、弱光环境,遮挡等;同时,对于检测的形式不再局限于图像,要求能够实时检测,并且在检测的基础上还需加入跟踪、行为识别等功能。此外,随着深度学习近年来的迅猛发展,越来越多的深度学习模型开始广泛应用于计算机视觉的各项技术中。例如,从随处可见的车牌识别、行人检测,到高级辅助驾驶的各类相关技术。与传统的行人检测方法相比,基于卷积神经网络的行人检测方法大幅提高了检测精度与速度;但是现有的YOLO v3模型提取的特征过于单一,导致在识别时精准度不高。
发明内容
本发明要解决的技术问题,在于提供一种基于改进YOLO v3模型的行人检测方法,克服原有YOLO v3模型提取的特征过于单一的问题,提高行人检测的精度。
第一方面,本发明提供了一种基于改进YOLO v3模型的行人检测方法,包括:
步骤1、选取训练样本;
步骤2、对样本进行K-means值聚类计算,获得新的anchors值,将新的anchors值替换原始YOLO v3模型中的数据集参数;
步骤3、引入inception模块,并将inception模块进行裁剪优化,得到改进后的YOLO v3模型;
步骤4、使用改进后的YOLO v3模型对行人进行检测,得到检测结果。
2、根据权利要求1所述的一种基于改进YOLO v3模型的行人检测方法,其特征在于:所述步骤1进一步具体为:从公开数据集pascal voc2007和pascalvoc2012数据集中分别提取其中的行人图像,以训练集:测试集为2:1的比例选取训练样本。
进一步地,所述步骤2进一步具体为:
采用非线性映射θ,将样本xi(i=1,2,…,l)映射到高维度空间G中,即样本为θ(x1),θ(x2),...,θ(xi);
在高维度空间进行K-means聚类操作,将函数最优化
其中,样本均值mk可由下式得出:
在核空间中,计算两个特征点的核距离
其中,N是核函数。
将聚类得到的所有样本子集进行合并,则样本子集的并集中包含了K个目标类别,分别计算其均值
其中,ni表示该类别的数据量,xi表示第i类的均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911257993.X/2.html,转载请声明来源钻瓜专利网。