[发明专利]一种基于改进损失函数的MDSSD人脸检测方法有效
申请号: | 202011047720.5 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112163520B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 王智文;安晓宁;王宇航 | 申请(专利权)人: | 广西科技大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/762;G06V10/774;G06V10/764;G06K9/62 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 朱宝庆 |
地址: | 545006 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 损失 函数 mdssd 检测 方法 | ||
本发明公开了一种基于改进损失函数的MDSSD人脸检测方法,包括,MDSSD网络利用先验框机制对人脸区域检测并对候选区域进行分类和框回归;根据k‑means对Ground Truth框进行聚类分析,寻找最佳的先验框数量、大小和比例;所述MDSSD网络将Focal loss代替分类网络中的交叉熵损失函数,对聚类分析后的所述先验框进行人脸和背景的检测分类。本发明对标注人脸的Ground Truth框进行聚类分析,以寻找每个检测层的最佳先验框数量和比例;同时,本发明训练了MDSSD模型并对模型进行测试分析,实验结果显示,MDSSD算法相对于SSD其对小脸和模糊人脸召回率更高,同时其仍然保持了较快的检测速度。
技术领域
本发明涉及小脸检测的技术领域,尤其涉及一种基于改进损失函数的MDSSD人脸检测方法。
背景技术
随着深度学习的兴起,与人脸相关的智能分析技术成为人工智能领域研究的重点和热点,新的算法不断刷新着人脸相关任务的评分,目前人脸识别技术已经超越人类的最高水平,同时与人脸相关的工业应用也是最广泛的。例如与人脸检测相关的应用有智能安防、城市大脑、安全驾驶以及中国的天网系统等;与人脸识别的相关应用包括人脸支付、智能门禁、人脸考勤、各种智能终端设备的人脸验证等,人脸相关的技术与各种系统的安全息息相关。同时与人脸相关的技术也在不断的应用到生活的方方面面,比如走失儿童寻找、智慧教育等。进一步随着计算机计算能力的提高和5G网络的应用,数据储存的成本和数据传输的延时会越来越低,与人脸相关应用会部署到越来越多的智能终端上,真正实现智能社会而造福人类。人脸检测即智能终端在输入图像上判断是否有人脸存在,并找出人脸所在的位置。人脸检测技术的前提就是能准确的检测到人脸,而不受人脸图像背景的影响。因此人脸检测作为人脸相关任务的基础和核心技术,受到研究人员的广泛关注。
基于SSD算法的人脸检测模型能快速准确的识别自然场景图像中的人脸,同时该算法具有较高的检测速度,但是SSD人脸检测算法对自然或非自然场景下小脸检测的召回率仍然有较大的提升空间,因此需要构建新的网络MDSSD模型,即Mix DeconvolutionSingle ShotMultiBox Detector用于人脸检测,MDSSD算法对SSD算法在人脸检测方面的诸多缺点进行改进,包括模型结构、检测特征图、参数配置、损失函数等,并通过机器学习方法对模型进行配置以减少人为经验干预,大幅度提高了模型的检测效果。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种基于改进损失函数的MDSSD人脸检测方法,能够解决对自然或非自然场景下小脸检测的召回率不高的问题。
为解决上述技术问题,本发明提供如下技术方案:包括,MDSSD网络利用先验框机制对人脸区域检测并对候选区域进行分类和框回归;根据k-means对Ground Truth框进行聚类分析,寻找最佳的先验框数量、大小和比例;所述MDSSD网络将Focal loss代替分类网络中的交叉熵损失函数,对聚类分析后的所述先验框进行人脸和背景的检测分类。
作为本发明所述的基于改进损失函数的MDSSD人脸检测方法的一种优选方案,其中:所述MDSSD网络包括,对深层特征图或深层融合层进行0填充,结合3*3卷积对填充特征图进行反卷积运算,在保证感受野范围不变的条件下使所述特征图的分辨率翻倍;利用与浅层特征图通道维度相同的卷积核数量以保证所述反卷积运算输出维度与所述浅层融合特征图维度匹配;MDSSD特征融合时只对所述浅层特征图与反卷积特征图对应位置进行相加运算,以增强有效上下文信息;所述MDSSD通过在融合层添加激活层以进行非线性映射,并将激活后的所述融合层作为最终的检测特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西科技大学,未经广西科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011047720.5/2.html,转载请声明来源钻瓜专利网。