[发明专利]一种基于卷积神经网络进行度量学习的人脸年龄估计方法有效
申请号: | 201810048365.X | 申请日: | 2018-01-18 |
公开(公告)号: | CN108171209B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 潘虹宇;韩琥;张杰;山世光;陈熙霖 | 申请(专利权)人: | 中科视拓(北京)科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100086 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于卷积神经网络进行度量学习的人脸年龄估计方法,其整体步骤为:构建数据集;将数据集划分为训练集、验证集;在网络输入层对mini‑batch进行成对构建,然后送入两个孪生网络中进行训练;对VGG‑16网络进行构建;网络训练;使用softmax loss和revised contrastive loss共同作为监督信号对网络进行调整;网络测评;最终估计的年龄为softmax层得到的最大概率对应类别。本发明将深度学习与度量学习相结合,通过引入度量学习,使得特征空间的区分度更高,进而年龄估计算法的鲁棒性更强;利用深度学习将特征提取任务和目标函数优化任务结合,将整个任务实现端到端的训练,应用在公开数据集上时可以取得较好的性能。 | ||
搜索关键词: | 一种 基于 卷积 神经网络 进行 度量 学习 年龄 估计 方法 | ||
步骤一、数据提取阶段:利用现有的人脸检测引擎对人脸RGB图像进行人脸检测和关键点定位,对人脸图像进行对齐,移除平面内旋转变化并归一化人脸大小,最终裁切出人脸区域将人脸图像保存为256×256像素大小;
步骤二、年龄数据集划分:将年龄数据集按照80%作为训练集、20%作为验证集进行随机划分,保证同一个人的数据仅出现在一个集合中;
步骤三、训练数据构建:为了方便训练,在输入层对mini‑batch成对进行构建;每一对样本保证前一个样本的label大于等于后一个样本的label;然后将它们分别送入到两个孪生网络中进行训练,孪生网络的参数共享;
步骤四、年龄估计网络的结构:选用由13个卷积层和3个全连接层组成的VGG‑16网络作为卷积神经网络;每一个卷积层后都紧跟有ReLU层;为了增加网络高层特征的感受野,在第2个、第4个、第7个、第10个和第13个卷积层后连接一个MaxPooling层;在倒数第二个全连接层后连接一个revised contrastive loss层,用于计算revised contrastive loss;最后一层全连接层后连接一个softmax loss层,用于计算softmax loss;最后的loss是softmax loss加上revised contrastive loss得到;
步骤五、年龄估计网络训练:在进行年龄数据集训练之前,利用大规模数据对深度学习网络模型进行预训练,使得网络模型具有识别能力;然后利用划分得到的训练集对网络模型进行训练;
步骤六、网络调整:在年龄估计网络训练过程中,使用softmax loss和revised contrastive loss共同作为监督信号对网络进行调整,使得最终得到的特征空间区分度更高,能够更容易进行分类;因此,将最终的损失函数loss表示为公式一;然后通过该损失函数对网络模型进行步骤五中的网络训练;
其中,N是批处理的样本个数;p是softmax层得到的输出;i是N对样本中前一个样本,j是N对样本中后一个样本;yi、yj均是真实年龄的类别;pi,yi是第i个样本为第yi类的概率;pj,yj是第j个样本为第yj类的概率;f(·)表示卷积神经网络的输出;α是用于调整不同类别之间间隔的超参数,通常设置为1;λ是用于平衡softmax loss和revised contrastive loss的超参数,可通过常规实验得到;
步骤七、网络测评:在深度学习网络模型训练完成后,选用年龄估计问题中常用的评测协议MAE作为验证集的测试标准,对网络模型进行测评,选出性能最好的模型;MAE的计算公式如下:
其中,yi是真实年龄;是估计年龄;
步骤八、最终softmax层会得到N类中每一类的一个概率值,概率值最大的类别即是最终估计的年龄。
2.根据权利要求1所述的基于卷积神经网络进行度量学习的人脸年龄估计方法,其特征在于:所述步骤五中对深度学习网络模型进行预训练的具体方法为:首先,利用ImageNet数据集进行预训练,使得预训练后的深度学习网络模型具有分类能力;然后,再利用IMDB‑WIKI数据集进行进一步预训练,使得整个网络具有年龄估计能力。该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科视拓(北京)科技有限公司,未经中科视拓(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810048365.X/,转载请声明来源钻瓜专利网。
- 上一篇:信息获取方法和装置
- 下一篇:一种植被覆盖区蚀变遥感异常信息的提取方法及系统