[发明专利]一种基于YOLO的人脸检测方法在审
申请号: | 201911235709.9 | 申请日: | 2019-12-05 |
公开(公告)号: | CN110826537A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 邓裕强;梁礼强 | 申请(专利权)人: | 广州市久邦数码科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510055 广东省广州市越秀区中山三路33号中华国际中心A塔1601、16*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolo 检测 方法 | ||
本发明公开了一种基于YOLO的人脸检测方法,通过端对端实现,无需额外的特征工程协助,推断速度快,计算速度约0.09秒每张图,可以实时应用,对人物姿势,角度、以及部分遮挡等条件兼容性较好,召回率高,鲁棒性强。
技术领域
本发明涉及图形图像处理技术领域,具体涉及一种基于YOLO的人脸检测方法。
背景技术
物体检测任务中的主流技术YOLO,原版YOLO模型主要的问题在于模型参数多、物体检测精准度率不高等。对于场景适用性的修改,包括在主干网络(Back bone)的优化以及锚点(anchor)和类别数量的调整,已将参数数量大大降低,模型文件从原版的238MB降低到23MB。由于应用场景的改变,无法对比修改后是否有精度上的提升,而且,由于模型设计上的天然弊端,精度上仍存在若干不可避免的缺陷。目前现有对人脸检测技术多基于传统图像处理进行特征提取,再通过统计机器学习方法进行推断,主要存在的问题是召回率较低,或对人脸角度,遮挡等条件比较苛刻,鲁棒性不高。
发明内容
本发明的目的在于提供一种基于YOLO的人脸检测方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案,一种基于YOLO的人脸检测方法,包括以下内容:
S100:以MobileNet v2网络模型为输入值为416*416的RGB格式图像,本部分用作图像特征抽取操作,将原始图像映射到高纬度的特征图;
S200:在输出端采用深度可分离卷积操作,适应在不同尺度下人脸检测框并输出;
S300:调整类别数量,通过模型训练区分预测类别是否需含人脸,根据场景的特殊性做必要的修改;
S400:调整锚点,适应人脸检测的尺度大小和人脸长宽比,标注训练过程识别到的人脸区域;
S500:输出各个锚点对应的预测边界框,根据预设阈值过滤至信息低的边界框,使用非最大抑制算法过滤多余边界框;
S600:输出图像中所有的人脸边界框。
进一步的,所述深度可分离卷积可以对特征金字塔进行微调,使得不同感受野的特征更好的融合,可以更好的适应不同尺度下人脸检测框的输出;
进一步的,所述模型训练过程中进行数据标注,推断过程输出的合理性;
本发明所述的一种基于YOLO的人脸检测方法,通过端对端实现,无需额外的特征工程协助,推断速度快,计算速度约0.09秒每张图,可以实时应用,对人物姿势,角度、以及部分遮挡等条件兼容性较好,召回率高。
附图说明
为了更清楚地说明本发明的实施例的技术方案,下面将对本发明的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明的一种基于YOLO的人脸检测方法流程图。
具体实施方式
为了使本发明的目的,技术方案和有点更加清楚,下面结合附图对本发明作进一步的阐述解释。本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的实施例保护范围。
本发明技术使用MobileNet v2网络作为主干网络,降低了模型参数数量,同时间增加了模型计算。
本技术方案是采用tensorflow/keras框架进行开发以及部署,发明技术使用MobileNet v2网络作为主干网络,降低了模型参数数量,同时间增加了模型计算包括以下内容:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市久邦数码科技有限公司,未经广州市久邦数码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911235709.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:吸箱抓包两用码垛抓手
- 下一篇:一种多方位调节式纺织布料裁剪机构