[发明专利]一种基于全局注意力的人脸特征点定位方法及系统有效
申请号: | 202010886980.5 | 申请日: | 2020-08-28 |
公开(公告)号: | CN112084911B | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 张卡;何佳;戴亮亮;尼秀明 | 申请(专利权)人: | 安徽清新互联信息科技有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/82;G06V10/80;G06N3/045;G06N3/0464;G06N3/047;G06N3/048;G06N3/08 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 苗娟 |
地址: | 230088 安徽省合肥市高新区创新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 全局 注意力 特征 定位 方法 系统 | ||
1.一种基于全局注意力的人脸特征点定位方法,其特征在于:
获取人脸局部图像;
把获取到的图像输入事先训练好的基于全局注意力的人脸特征点定位模型,对于输入的人脸局部图像,经过基于全局注意力的人脸特征点定位模型前向运算后,直接输出人脸特征点位置;
其中,
所述基于全局注意力的人脸特征点定位模型的网络结构包括:
conv0层是一个核尺寸为7×7,跨度为2×2的卷积层;
maxpool0层是一个核尺寸为2×2,跨度为2×2的最大值池化层;
conv0层和maxpool0层共同组成了一个特征图分辨率快速下降网络;
resblock0、resblock1、resblock2、resblock3均是resnet网络的resblock残差模块;
GFM0、GFM1、GFM2、GFM3均是全局注意力融合模块;
ave-pool层是一个全局均值池化层;fc层是一个输出特征为2xN维的全连接层,N表示人脸特征点的个数;
所述全局注意力融合模块的具体网络结构包括:
gfmconv0、gfmconv1、gfmconv2均是核尺寸为1×1,跨度为1×1的卷积层,reshape0、reshape1、reshape2、reshape3均是特征图尺寸变换层,其作用是调整输入特征图尺寸以满足后续特征层运算的需要;
globalavepool0是一个基于特征图通道维度的全局均值池化层,globalmaxpool0是一个基于特征图通道维度的全局最大值池化层;globalavepool0层的输出特征图和globalmaxpool0层的输出特征图按通道维度进行拼接;gfmconv是一个核尺寸为7×7,跨度为1×1的卷积层,用于提取输入特征图上各个像素位置的重要程度权值;
sigmod层是sigmod类型的激活函数;scale层是按像素加权层,其作用是对输入特征图按照像素位置进行逐个加权,加权计算过程如公式(1),globalavepool0、globalmaxpool0、gfmconv、sigmod、scale共同组成了一个空间注意力机制模块;softmax层作用是按照输入特征图的第2维度进行softmax类型的激活操作,以获取输入特征向量的概率分布值;
matmul0、matmul1均是特征图相乘运算层,遵循通用的矩阵相乘法则;matsum是特征图相加运算层,用于把两个输入特征图按对应元素相加合并成一个输出特征图;
Oc(x,y)=w(x,y)*Ic(x,y) (1)
其中,Oc(x,y)表示输出加权特征图的第c个通道(x,y)位置处的数值,w(x,y)表示输入特征图的(x,y)位置处的重要程度权重值,Ic(x,y)表示输入特征图的第c个通道第(x,y)位置处的数值;
输入特征图分别作为gfmconv0层、gfmconv1层、globalavepool0层、scale层、matsum层的输入,gfmconv0层的输出作为reshape0层的输入,gfmconv1层的输出作为reshape1层的输入,reshape0层的输出和reshape1层的输出均作为matmul0层的输入,matmul0层的输出作为softmax层的输入,globalavepool0层的输出作为globalavepool1层的输入,globalavepool1层的输出作为gfmconv层的输入,gfmconv层的输出作为sigmod层的输入,sigmod层的输出和输入特征图均作为scale层的输入,scale层的输出作为reshape2层的输入,reshape2层的输出和softmax层的输出均作为matmul1的输入,matmul1的输出作为reshape3层的输入,reshape3层的输出作为gfmconv2层的输入,gfmconv2层的输出和输入特征图均作为matsum的输入,matsum层的输出就是输出特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽清新互联信息科技有限公司,未经安徽清新互联信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010886980.5/1.html,转载请声明来源钻瓜专利网。