[发明专利]一种基于改进的Mixed Pooling-YOLOV3目标检测方法有效
申请号: | 202010146020.5 | 申请日: | 2020-03-05 |
公开(公告)号: | CN111353544B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 郝琨;郭飞;赵璐 | 申请(专利权)人: | 天津城建大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/80;G06N3/0464;G06N3/08 |
代理公司: | 石家庄知住优创知识产权代理事务所(普通合伙) 13131 | 代理人: | 林艳艳 |
地址: | 300384 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 mixed pooling yolov3 目标 检测 方法 | ||
本发明公开了一种基于改进的Mixed Pooling‑YOLOV3目标检测方法,基于回归的思想进行目标检测算法的设计,实现了多尺度和多标签的分类。本发明基于目前一阶段目标检测方法YOLOV3的不足,设计了基于Darknet‑53结构的DMP网络作为特征提取器;其次,对原有损失函数进行重构,同时也对其参数进行优化,有效提升了检测精度,也使得收敛更加快速。DMP框架兼顾了网络的复杂度与检测的准确率,与常用的目标检测特征提取网络VGG‑16相比降低了模型运算量,本专利方法将计算机视觉的最新进展引入到目标检测领域中,在检测精度和检测速度上都有良好的效果,同时具有更好的性能和推广应用前景。
技术领域
本发明涉及计算机视觉、深度学习技术、目标检测的技术领域,特别是涉及一种基于改进的Mixed Pooling-YOLOV3的目标检测方法。
背景技术
作为计算机视觉中最基本和最具有挑战性的问题之一,目标检测近年来受到了极大的关注。目标检测是一项基本计算机视觉任务,它提供了用于图像和视频理解语义分割的基本信息,也能够用于检测数字图像中特定类别视觉对象的实例,因此受到了广泛的关注。目标检测的目的在于开发一个能够提供给计算机视觉应用程序所需基本信息的计算模型和技术:什么样的目标,它是在哪儿?从应用角度来看,目标检测可以分为两个研究主题:“一般物体检测”和“检测应用”,前者的意义在于统一框架下利用不同的目标检测方法去模拟人类的视觉和认知,后者的目的在于针对特定的应用场景下对特定的物体进行检测,如行人检测、人脸检测、文本检测等等。从目标检测的历程来看,目标检测分为两个历史阶段:传统目标检测时期(2014年以前)和基于深度学习的目标检测时期,P.Viola和M.Jones等人首次提出实现了实时人脸检测的Viola-Jones(VJ)detector,VJ detector采用最直接的检测方式,即滑动窗口查看所有可能包含人脸的位置和比例,以便查看是否存在人脸,虽然过程比较简单,VJ detector结合了“图像整体”、“特征选择”和“级联检测”三项重要的技术,极大提升了检测的速度;2005年N.Dalal和B.Triggs等人提出HOG(Histogram of OrientedGradients),HOG被认为当时尺度不变特征变换和形状上下文的重要改进,主要用于检测不同的目标对象类,尤其是行人检测问题;P.Felzenszwalb等人于2008年提出DPM(Deformable Part-based Model),作为一种基于组件的检测算法,创造了传统目标检测方法的巅峰。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津城建大学,未经天津城建大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010146020.5/2.html,转载请声明来源钻瓜专利网。