[发明专利]一种基于混合注意力特征金字塔结构的轻量化人脸检测方法和系统有效
申请号: | 202110957384.6 | 申请日: | 2021-08-19 |
公开(公告)号: | CN113591795B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 李志丹;田甜;潘齐炜;曾蕊;程吉祥;黄思维 | 申请(专利权)人: | 西南石油大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/774;G06V10/80;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 深圳峰诚志合知识产权代理有限公司 44525 | 代理人: | 胡石开 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 注意力 特征 金字塔结构 量化 检测 方法 系统 | ||
1.一种基于混合注意力特征金字塔结构的轻量化人脸检测方法,其特征在于,包括以下步骤:
S1、收集复杂场景中含有多个小尺寸人脸的图像,对图像中人脸进行标注,构成训练集;所述小尺寸人脸指一幅图像中超过50%以上的人脸尺寸小于25像素*25像素或者小于整幅图像的0.03*0.03;所述标注包括用包围框对图像中的人脸位置进行标注以及标注图像中人脸数量;
S2、对步骤S1中的训练集图像进行缩放处理及数据增强,得到预处理的人脸图像;
S3、构建人脸检测卷积神经网络;所述人脸检测卷积神经网络使用轻量化骨干网络对步骤S2中预处理的人脸图像提取特征并对提取的特征进行处理并融合:首先使用采样函数对特征层进行尺度变换并在多个特征尺度上分别融合不同特征层的特征,然后依次使用残差结构、瓶颈层结构、混合注意力模块处理融合的特征,最后输出到预测层进行计算,具体包括如下步骤:
首先使用采样函数对特征层进行尺度变换,对所述轻量化骨干网络提取的特征经过上采样和下采样后分别在不同尺度上进行融合;若骨干网络提取的特征尺度由小到大分别为f1,f2,f3那么所得到的融合后的特征层F1,F2,F3由小到大表示为:
F1=f1+Fdownsample×f2+Fdownsample×f3
F2=Fupsample×f1+f2+Fdownsample×f3
F3=Fupsample×f1+Fupsample×f2+f3
其中:Fupsample表示上采样函数,Fdownsample表示下采样函数;
接着使用残差瓶颈层处理经尺度变换融合的特征层,所述残差瓶颈层结构包括1*1卷积层、批次归一化层、激活函数层、3*3卷积层和残差连接;其过程可表示为:
Foutput=F1*1(F3*3(F1*1(Finput)))+Finput
其中:Foutput表示输出特征,F1*1表示使用1*1大小的卷积计算,F3*3表示使用3*3大小的卷积计算,Finput表示输入特征,每个卷积计算后都使用批次归一化层和激活函数层;
最后将经过残差瓶颈层结构的特征层通过混合注意力模块两两融合后作为预测层进行输出;所述混合注意力模块由通道注意力子模块和空间注意力子模块并行组合而成;对于混合注意力模块的输入特征层Fin,混合注意力模块的输出特征Fout表示如下:
其中:δ表示使用sigmoid函数,Fc表示经过通道注意力子模块的特征,Fs表示经过空间注意力子模块的特征;Fc和Fs表达式如下:
Fc(X)=Pwconv(δ(AvgPool(Pwconv(X))+MaxPool(Pwconv(X))))
Fs(X)=Pwconv(δ(Conv7*7((AvgPool(Pwconv(X));MaxPool(Pwconv(X))))))
其中Pwconv(x)表示使用1*1逐点卷积,AvgPool(x)表示使用平均池化函数,MaxPool(x)表示使用最大池化函数,Conv7*7表示使用卷积核大小为7*7的卷积;
S4、将步骤S2中的得到的预处理图像输入到步骤S3构建的人脸检测卷积神经网络结构中进行人脸检测神经网络训练;训练时使用无锚检测方法对输入预测层中的图像特征进行计算并将图像中的人脸用矩形框标注,得到带人脸矩形框的图像,损失函数使用聚焦损失函数,所述聚焦损失函数通过网络训练让预测值拟合出真实值,直到损失函数收敛;聚焦损失函数使用平衡因子作为损失函数附加的权重来调节正负样本的优化,使用可调聚焦参数调节简单样本和复杂样本的优化;通过对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数E;
S5、设置优化策略和相关超参数训练人脸检测网络,迭代训练直至损失函数收敛,并保存网络训练权重参数;
S6、基于步骤S3构建的人脸检测卷积神经网络和步骤S5获得的网络训练权重参数构建基于混合注意力特征金字塔结构的人脸检测模型,并以该检测模型对待检测图片进行人脸检测,同时,检测模型将记录所有检测得到的人脸矩形框以确定检测到的人脸数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学,未经西南石油大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110957384.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快拆式集电总成
- 下一篇:一种快速农作物播种设备