[发明专利]基于注意力指导轻量级网络的人脸关键点检测方法在审
申请号: | 202211522066.8 | 申请日: | 2022-11-30 |
公开(公告)号: | CN115966004A | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 王波;乔伟晨;吴笛;张沅;王晓东;夏建乐;刘吉伟;罗东 | 申请(专利权)人: | 长城信息股份有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06N3/048;G06N3/084;G06N3/0464 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 欧阳迪奇 |
地址: | 410100 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 指导 轻量级 网络 关键 检测 方法 | ||
1.一种基于注意力指导轻量级网络的人脸关键点检测方法,其特征在于,包括以下步骤:
步骤一,构建由教师网络和学生网络组成的训练模型;
其中教师网络包括由多个bottleneck块和CBAM注意力模块组成的编码器,以及由多层反卷积层组成的解码器;
学生网络包括由多个bottleneck块组成的编码器,以及由多层反卷积层组成的解码器;
步骤二,将用于训练的人脸图像输入至教师网络中,并基于教师网络的损失函数对教师网络进行循环迭代训练,直至达到终止训练条件;然后再将用于训练的人脸图像分别输入至学生网络和训练完成的教师网络中,并基于学生网络的损失函数来对学生网络进行循环迭代训练,直至达到终止训练条件;
步骤三,将需要进行人脸关键点检测的图像输入训练完毕后的学生网络中,从而获得人脸关键点检测结果。
2.根据权利要求1所述的方法,其特征在于,所述的步骤一中,教师网络和学生网络中的bottleneck块包括用于将输入分为两个分支的channel split单元,且其中一个分支经第一1×1卷积、深度可分离卷积和第二1×1卷积后,与另一个不经处理的分支输入ChannelShuffle单元处理后输出特征图F∈RC×H×W,其中C、H和W分别表示特征图的通道数、高度和宽度,R表示实数。
3.根据权利要求2所述的方法,其特征在于,所述的步骤一中,教师网络中的CBAM注意力模块的输入为F∈RC×H×W,输出为特征注意力图A∈RM×H×W,计算公式为:
F1=channel split(F)
F2=channel Shuffle(Fi)
其中,和分别表示经过全局平均池化层和全局最大池化层计算后的特征值;W0和W1代表的是CBAM注意力模块中的两层参数;σ表示的是sigmoid激活函数,dwf7×7表示使用深度可分离卷积层的7×7卷积核,f1×1表示使用卷积层1×1的卷积核,M是注意力图的数量,Mc(F2)表示特征经过CBAM注意力模块获得的通道注意力特征,Ms(F2)表示通过7×7卷积核的空间注意力特征,M(F2)表示融合通道和空间注意力的结果,k=1,2...,M。
4.根据权利要求1所述的方法,其特征在于,所述的步骤一中,教师网络中的反卷积层包括256个2×2的卷积核,并在最后设有一个1×1的卷积核;以通过扩大输入图像的尺寸、旋转卷积核和正向卷积来输出预测点数。
5.根据权利要求1所述的方法,其特征在于,所述的步骤二中,教师网络的损失函数为
Lt=Lwing(x)+Le
学生网络的损失函数为:
其中Lwing(x)为孤立点损失函数,Lc为检查点特征中心损失函数,为逐步像素损失函数。
6.根据权利要求5所述的方法,其特征在于,孤立点损失函数Lwing(x)采用分段函数Wingloss实现,计算公式为:
其中w是将非线性部分的范围限制在[-w,w]区间内;∈是约束非线性区域的曲率;C=w-wln(1+x/∈),为一个常数,以平滑连接分段的线性和非线性部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长城信息股份有限公司,未经长城信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211522066.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种沥青物料混合加工装置
- 下一篇:一种活塞加工机床及方法