[发明专利]一种人脸多属性识别系统有效
申请号: | 201911310537.7 | 申请日: | 2019-12-18 |
公开(公告)号: | CN111339818B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 吴元明;袁利娟;万军;孙茂;李子青;谭资昌 | 申请(专利权)人: | 中国人民解放军第四军医大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06N3/08 |
代理公司: | 北京中索知识产权代理有限公司 11640 | 代理人: | 周国勇 |
地址: | 710032 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人脸多 属性 识别 系统 | ||
1.一种人脸多属性识别系统,其特征在于,所述系统包括:
预处理单元,用于确定人脸图像,并将所述人脸图像裁剪成预设尺寸;
人脸属性网络单元,所述人脸属性网络单元包括底层特征抽取模块、人脸属性关系模块ARM和上下文关系模块CRM,所述底层特征抽取模块用于抽取底层的神经网络特征,所述ARM用于发现和捕获多个属性之间的相关性,所述CRM用于探索不同图像区域之间的上下文关系;
训练单元,用于训练一个人脸属性预测网络,通过所述人脸属性预测网络预测各个属性;
预测单元,用于将预处理好的人脸图像输入到训练好的人脸属性预测网络中,得到各个人脸属性的预测值;
所述CRM具体用于:
给定输入要素所述输入要素在GAP层之前获得,所述h、所述w分别表示要素图的高度和宽度;
采用图形投影方法将二维图像投影到一组聚类/节点上,预先指定v的数量,采用软分配方案计算权重,以将Pth像素分配给k th簇,具体如下公式(4)所示:
其中,和bk是kth集群的可训练参数,和bl也是可训练参数,所述bl和bk的索引不同;是第p个像素的特征值,Pth是指第p个像素,是指一个输入的特征值;
给定v个可学习的节点通过使用输入要素和顶点Ck之间的残差加权平均值聚合节点的特征,具体如公式(5)所示:
聚合的特征进行L2归一化,得到如下公式(6):
不同的节点包含来自不同图像区域的特征,所有节点的特征表示为矩阵形式,每行代表一个图形节点,具体如下公式(7):
基于特征Vi的具有v个节点的图,根据如下公式(8),用GCN层在所有节点之间传递信息并更新状态,捕获不同区域之间的前后关系:
其中,表示ReLU函数,Ac是学习的相邻矩阵,是规范化相邻矩阵,Wc表示另一个图卷积层中滤波器的参数矩阵;
串联所有节点的新状态,并表示为根据更新的状态获得第三预测分数,具体如下公式(9)所示:
其中,wc指分类器的参数;
所述预测单元具体用于:
将目标图像输入到所述预处理单元处理;
将预处理过的人脸图像输入训练好的人脸属性预测模型中,网络前向传递,经过所述ARM和所述CRM两个分支以后,得到人脸属性预测值和
将所述和所述做算数平均,生成最终的预测值,表示为如下公式(13):
以计算年龄、性别、是否戴墨镜、长短发属性的概率。
2.根据权利要求1所述的系统,其特征在于,所述预处理单元具体用于:
输入图像,对所述图像进行人脸检测,判断所述图像中是否包含人脸,如果不包含人脸,则放弃所述图像;
如果所述图像包含人脸,则将所述图像确定为人脸图像,并对所述图像进行关键点定位,得到两眼中心及上嘴唇点的位置;
根据所述两眼中心及上嘴唇点的位置,对图像进行旋转、缩放、对齐,并裁剪成预设尺寸,输出裁剪后的图像。
3.根据权利要求1所述的系统,其特征在于,所述底层特征抽取模块具体用于:
利用残差网络结构ResNet-50中除最后三个残差单元外的剩余网络作为底层特征抽取模块,抽取底层的神经网络特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军第四军医大学,未经中国人民解放军第四军医大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911310537.7/1.html,转载请声明来源钻瓜专利网。