[发明专利]一种基于深度学习的实时场景小脸检测方法在审
申请号: | 201910003383.0 | 申请日: | 2019-01-03 |
公开(公告)号: | CN109886083A | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 杭丽君;丁明旭;叶锋;赵兴文;宫恩来 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于深度学习的实时场景小脸检测方法,本发明首先将包含更多小脸信息的更底层特征和涵盖丰富语义特征的顶层特征层融合起来进行级联检测,来提高模型的小脸检出能力。其次根据实时监测场景下的人脸尺度调整生成的预测框尺度和比例。最后本发明在预测阶段引入soft and hard nms算法筛选预测框,将softnms和传统nms算法融合,设立两个阈值将预测框按照IoU划分为不同段,对处于不同阈值范围内的预测框置信度分数采取不同的方式进行重打分,更精准地剔除不必要的预测框。本发明更容易整合在基于深度学习任务中的人脸检测架构中,适用于人流量较大场合。 | ||
搜索关键词: | 预测 实时场景 脸检测 尺度调整 底层特征 人脸检测 实时监测 算法融合 语义特征 人流量 特征层 置信度 顶层 级联 检出 人脸 算法 学习 整合 剔除 架构 尺度 筛选 场景 涵盖 融合 引入 检测 | ||
【主权项】:
1.一种基于深度学习的实时场景小脸检测方法,其特征在于,该方法具体包括以下步骤:步骤(1)、将数据集中的图像读入网络结构,对图像经过卷积层,池化层提取图像特征,形成特征层;步骤(2)、从提取的特征层中,选取能使网络模型实现最高预测效果的特征层,进行特征层融合;步骤(3)、对融合的特征层进行分类预测,最后使用改进后的非极大值抑制算法剔除冗余的检测框,保留精准的检测框作为预测输出;步骤31)、对选取的融合特征层进行分类预测,判断是否存在对应物体,生成对应置信度Si;步骤32)、设置两个阈值最小min和最大max;步骤33)、使用soft and hard nms算法筛选预测框计算出每个预测框与最大置信度预测框的交并比IoU,对于交并比IoU在min之下的的预测框,不施以惩罚,对其置信度分数予以保留;对于处于min和max之间的预测框,在非极大值抑制算法中引入的高斯函数重打分,并且施以较小的惩罚的因数获得更新后的置信度分数,而对于IoU处于max之上的预测框,同样送入高斯函数进行重打分机制,并且施以较重的惩罚因数;其对应函数为:
步骤34)、计算剩余集合中预测框与M的IoU(M,bi),判断该IoU值与max以及min的大小,进入不同区段进行不同的重打分进程;公式中M对应每一轮筛选中的最大置信度预测框,bi对应每一轮剩下集合中的第i个预测框,其原始置信度是Si,σ表示正态分布的标准偏差;步骤35)、输出筛选过后的预测框。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910003383.0/,转载请声明来源钻瓜专利网。