[发明专利]一种基于多阶注意力机制融合的人脸属性识别算法及系统在审
申请号: | 202210964078.X | 申请日: | 2022-08-11 |
公开(公告)号: | CN115311719A | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 姚灿荣;张光斌;吴俊毅;高志鹏;赵建强;杜新胜;韩名羲 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/82;G06V10/80;G06V10/764;G06N3/08;G06N3/04 |
代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 郭涵炜 |
地址: | 361000 福建省厦门市思明*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 融合 属性 识别 算法 系统 | ||
1.一种基于多阶注意力机制融合的人脸属性识别算法,其特征在于,该算法包括:
响应于人脸检测方法和人脸对齐方法,获取图像中的完整人脸区域,并输出人脸图像;
将获取的人脸图像输入至卷积神经网络模型中,进一步提取该人脸图像的若干图像特征进行训练并处理;以及
同时将获取的人脸图像的图像特征输入至多阶注意力机制融合网络模型中进行训练和处理;
完成对该人脸图像的属性识别。
2.根据权利要求1所述的基于多阶注意力机制融合的人脸属性识别算法,其特征在于,所述卷积神经网络模型采用轻量化的MobileNetV2模型,其中,所述MobileNetV2模型包含8个残差卷积块{b0,b1,…,b7},每个残差卷积块由深度可分离卷积层-BN层-激活层-残差连接层组成。
3.根据权利要求2所述的基于多阶注意力机制融合的人脸属性识别算法,其特征在于,所述卷积神经网络模型提取人脸图像的图像特征的方式如下:
F=(B{Ii|θ1,θ2,…,θn})
其中,B代表所述MobileNetV2模型的前向运算,Ii代表输入RGB图像,θ1,θ2,…,θn代表残差卷积块的参数。
4.根据权利要求3所述的基于多阶注意力机制融合的人脸属性识别算法,其特征在于,利用所述MobileNetV2模型对图像特征进行训练并处理包括:
将获取的图像特征先经过一个全局池化层和分类层;
然后在BCE损失函数的约束下对所述MobileNetV2模型进行训练。
5.根据权利要求1所述的基于多阶注意力机制融合的人脸属性识别算法,其特征在于,所述多阶注意力机制融合网络模型采用Transformer模型。
6.根据权利要求1所述的基于多阶注意力机制融合的人脸属性识别算法,其特征在于,利用所述多阶注意力机制融合网络模型对人脸图像的图像特征进行训练和处理包括:
利用所述多阶注意力机制融合网络模型对人脸图像中的全局特征信息进行建模;
将获取所述全局特征信息作为所述多阶注意力机制融合网络模型的输入,经所述多阶注意力机制融合网络模型进行编码;
在BCE损失函数的约束下对所述多阶注意力机制融合网络进行优化约束后输出。
7.根据权利要求3或6所述的基于多阶注意力机制融合的人脸属性识别算法,其特征在于,所述BCE损失函数如下所示:
其中,N代表训练的图像数,M代表人脸属性类别数,logitsij代表分类层的输出,yij代表图像标签,σ(z)=1/(1+e-z),ωj表达式如下:
整个算法的损失函数表示式如下:
L=lbce1+lbce2
其中,lbce1代表所述MobileNetV2模型的损失函数,lbce2代表所述多阶注意力机制融合网络模型的损失函数,lbce1与lbce2的比例一致。
8.一种基于多阶注意力机制融合的人脸属性识别系统,其特征在于,包括:
获取模块:用于根据人脸检测方法和人脸对齐方法,获取图像中的完整人脸区域;
输入模块:用于将获取的人脸图像输入至卷积神经网络模型中,将获取的人脸图像的图像特征输入至多阶注意力机制融合网络模型中;
输出模块:用于输出人脸图像以及输出人脸图像的图像特征;
提取模块:用于对人脸图像的若干图像特征进行提取;
训练与处理模块:用于对提取的图像特征进行训练与处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210964078.X/1.html,转载请声明来源钻瓜专利网。