[发明专利]基于有序编码及多层随机投影的人脸图像年龄判别方法有效
申请号: | 201810413049.8 | 申请日: | 2018-05-03 |
公开(公告)号: | CN108446676B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 田青;刘成广;顾思宇;柯研;仲昭奕;吴俊凤 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李淑静 |
地址: | 210044 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 有序 编码 多层 随机 投影 图像 年龄 判别 方法 | ||
1.一种基于有序编码及多层随机投影的人脸图像年龄判别方法,其特征在于,所述方法利用基于多层ELM模型的双通道网络对人脸图像年龄进行判别,包括训练阶段和估计阶段,
在训练阶段,针对每个通道网络,使用多层ELM神经网络模型对输入的人脸图像进行特征映射,并对输出采用LDL进行输出编码,然后用平方损失函数来衡量预测输出编码与真实年龄之间的差异,通过梯度下降法来最小化该平方损失函数的值;最后通过对比损失函数融合两个通道网络,共同调节两个网络的参数;
在估计阶段:任选一个通道网络输入待评估的人脸图像,对输入的图像经过ELM的特征映射和输出LDL编码后,将LDL编码向量最大的分量所对应的年龄作为该待评估人脸图像的年龄估计结果;
其中,所述双通道网络如下:每个通道网络包括一个K层ELM分类器,该K层ELM分类器包括输入层、K层隐藏层、输出层,其中输入层有N个神经元,隐藏层有Q个神经元,输出层仅有1个神经元p,则多个隐藏层的第q个神经元有N个权值,表示为Wq,1,Wq,2,···Wq,N;输出层神经元p有Q个权值,表示为Wp,1,Wp,2,···Wp,Q;输入样本记为x,激活函数采用Sigmoid函数,形式为f(x)=1(1+e-x);
所述通过对比损失函数融合两个通道网络,共同调节两个网络的参数包括:
(41)修正输出层权值Wp,q和阈值θp,其中Wp,q(t+1)表示第t+1次修改的权值Wp,q;η为学习速率;yf和yg表示图像xf和xg通过网络学习得到的年龄;rf,rg为真实的年龄标签;为第K-1层隐藏层第q个神经元的输出;
(42)当求出了输出层权值之后,按给定指标判别是否满足要求,如果满足要求,则算法结束;如果未满足要求,则返回重新计算各层输出,再经过LDL编码后,继续执行步骤(41)。
2.根据权利要求1所述的基于有序编码及多层随机投影的人脸图像年龄判别方法,其特征在于,所述ELM分类器的计算过程包括以下步骤:
(11)随机初始化ELM神经网络:对ELM分类器各层的权值置一个非零随机数作为初值,但设置Wq,N+1=-θq,Wp,Q+1=-θp,其中θq为隐藏层神经元的阈值,θp为输出层神经元的阈值;
(12)输入一个样本x=(X1,X2,···,XN,1),以及对应的期望输出y;
(13)计算各个层的输出:对于第一层隐藏层第q个神经元的输出有:其中Xi+1=1,Wq,N+1=-θq;对于第M层隐藏层第q个神经元的输出有:其中Wq,N+1=-θq;对于输出层神经元p的输出Y,有:其中
3.根据权利要求2所述的基于有序编码及多层随机投影的人脸图像年龄判别方法,其特征在于,所述LDL编码采用高斯分布函数作为处理得到描述不同年龄的分布标准,函数如下:
其中,Y为通过多层ELM分类器的输出,σ代表标签标准偏差,j为不同年龄的分布。
4.根据权利要求3所述的基于有序编码及多层随机投影的人脸图像年龄判别方法,其特征在于,所述平方损失函数的形式为:其中y为图像实际年龄,E(j)为根据LDL编码的各个年龄的描述度得到的数学期望,计算公式为:jk为LDL编码后的年龄实例标签,P(jk)为各年龄标签的描述度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810413049.8/1.html,转载请声明来源钻瓜专利网。