[发明专利]移动端CPU实时多功能人脸检测方法有效
申请号: | 202011106815.X | 申请日: | 2020-10-16 |
公开(公告)号: | CN112232205B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 严安;周治尹 | 申请(专利权)人: | 中科智云科技有限公司;上海点泽智能科技有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06N3/04;G06N3/08 |
代理公司: | 上海十蕙一兰知识产权代理有限公司 31331 | 代理人: | 于露萍 |
地址: | 230000 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 移动 cpu 实时 多功能 检测 方法 | ||
1.一种移动端CPU实时多功能人脸检测方法,其特征在于,包括:
将图片放入预设的检测器中进行预测,通过所述检测器的主干网络中四个不同卷积层得到的特征与多个尺寸的锚点结合,进行人脸检测、人脸关键点检测和口罩识别,得到人脸框预测值、人脸关键点和口罩识别结果;具体地,
将图片放入训练后的所述检测器中进行预测,预测时将所述主干网络中的第8、11、13和15个卷积层中的特征分别输入到各个预测层进行人脸框、人脸关键点定位和口罩识别操作;
对于每个锚点,使用相对其坐标的4个偏移量以及N个用于分类的分数进行表示,N=2;在检测器训练时针对每个锚点,最小化式多任务损失函数:
其中Lobj为交叉熵损失函数检测锚点是否包含目标分类,pi为锚点有目标的概率,如果锚点包含目标,则否则为0;Lcls为交叉熵损失函数用于锚点分类,分为戴口罩类和未戴口罩类;Lbox采用smoth-L1损失函数用于人脸锚点定位,ti={tx,ty,tw,th}i为预测框的坐标偏移量,为正样本锚点的坐标偏移量;Llandmark采用smoth-L1损失函数用于人脸关键点定位,li={lx1,ly1,lx2,ly2,...,lx5,ly5}i为预测的关键点偏移量,为正样本关键点坐标偏移量,若样本为戴口罩li={lx1,ly1,lx2,ly2}i,其中lx1,ly1和分别代表左眼预测关键点坐标偏移量和正样本关键点偏移量,lx2,ly2和分别代表右眼预测关键点坐标偏移量和正样本关键点偏移量;λ1和λ2分别为人脸框和关键点损失函数的权重系数;
将所述人脸框预测值进行解码操作,转换为边界框的真实位置,将所述人脸关键点进行解码操作,转换为关键点的真实位置;
采用阈值为0.4的非极大值抑制算法消除重叠检测框,得到最终的人脸检测框、人脸关键点和口罩识别结果,包括检测框左上角坐标、右下角坐标、两只眼睛坐标、鼻子坐标、一对嘴角坐标和是否戴口罩置信度的信息。
2.如权利要求1所述的移动端CPU实时多功能人脸检测方法,其特征在于,所述将图片放入预设的检测器中进行预测之前,包括:
对图片进行预处理操作,所述预处理操作包括调整图像大小、标准化。
3.如权利要求1所述的移动端CPU实时多功能人脸检测方法,其特征在于,所述将图片放入预设的检测器中进行预测之前,还包括:
向所述检测器加载预设的预训练网络参数,根据预设的锚点的尺寸及长宽比例,生成默认锚点;
通过预设的数据集对所述检测器进行训练,得到训练后的检测器;
所述检测器包括主干网络、预测层和多任务损失层。
4.如权利要求3所述的移动端CPU实时多功能人脸检测方法,其特征在于,所述通过预设的数据集对所述检测器进行训练,得到训练后的检测器,包括:
采集包括未遮挡数据和遮挡数据作为数据集,将所述数据集中的BGR图片转换为YUV格式,进行数据增强,得到增强后的数据集;
采用动量为0.9,权重衰减因子为0.0005的随机优化算法进行网络训练,所述随机优化算法采用难样本挖掘的方式减少正负样本之间的不平衡,在训练的前100轮,初始化学习率设置为10-3,在之后的50轮和100轮各降低10倍,在训练期间,首先将每个预测值与最佳的Jaccard重叠锚点进行匹配,之后将锚点匹配到具有高于0.35阈值的Jaccard重叠人脸。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科智云科技有限公司;上海点泽智能科技有限公司,未经中科智云科技有限公司;上海点泽智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011106815.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于红外图像的活体检测方法
- 下一篇:一种高性能热轧取向硅钢钢板及其生产方法