[发明专利]基于自编码器的人脸图像旋转方法有效

专利信息
申请号: 201410529076.3 申请日: 2014-10-09
公开(公告)号: CN104298973B 公开(公告)日: 2018-03-30
发明(设计)人: 李玉鑑;郝利刚;张婷 申请(专利权)人: 北京工业大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 北京思海天达知识产权代理有限公司11203 代理人: 沈波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于自编码器的人脸图像旋转方法,依次包括以下步骤首先,采集每一位用户的原始正面和侧面人脸图像,并通过手工方式选取包含人脸的区域构成纯人脸图像,并以此作为用户人脸图像的模板;然后,将模板库中的彩色图像转换成灰度图像;其次,从自编码器的输入层到中间层,将相邻两层看作RBM,逐层训练每个RBM。将训练后RBM堆叠得到自编码器,并用训练RBM得到的权值和偏置作为自编码器的初始化权值和偏置;再次,使用反向传播算法逐层调整自编码器各层的权值和偏置;最后,使用新用户的侧面人脸图像,对训练过的自编码器进行测试,将侧面图像重建成正面人脸图像。该方法重建过程更加智能化。
搜索关键词: 基于 编码器 图像 旋转 方法
【主权项】:
一种基于自编码器的人脸旋转方法,其特征在于:该方法依次包括以下步骤,步骤1、建立人脸图像模板库,定义有N个用户,使用图像采集设备,为每一个用户拍摄正面和侧面原始人脸图像,拍摄侧面图像时,让人脸以正前方为基准,旋转一定角度进行拍摄;设人脸旋转的角度为α,‑45°≤α≤45°;获得原始人脸图像后,手工选择图像中只包含人脸部分构成纯人脸图像,每个用户选一张正面图像作为目标图像模板和m张侧面图像作为侧面图像模板,第c个用户的正面图像和侧面图像分别用Pc和表示,1≤c≤N,1≤m≤100,(c‑1)m+1≤t≤cm,用Hc和Wc分别表示正面图像的高和宽,和分别表示侧面图像的高和宽,用表示N个用户的纯人脸图像模板库,把N个用户的人脸图像模板SOF分成两部分,一部分为训练人脸库D1,包含每个用户的一幅正面图像和m幅侧面图像,用于训练自编码器;剩余用户的正面图像和侧面图像作为测试人脸库D2,用于测试训练后的自编码器;步骤2、如果纯人脸图像模板是彩色图像,则首先将彩色图像转换成灰度图像,用Rc(h,w)、Gc(h,w)和Bc(h,w)分别表示第c个用户正面人脸图像中第(h,w)个像素的红色分量、绿色分量和蓝色分量,根据著名灰度化心理学公式计算其灰度值如下:gc(h,w)=(Rc(h,w)×299+Gc(h,w)×587+Bc(h,w)×114+500)/1000灰度化后的人脸图像分别用表示;步骤3、使用训练人脸库D1中每个用户经过灰度化后的侧面图像为训练图像,每个用户对应的灰度化后的正面图像为目标输出,训练自编码器;定义自编码器包含2r‑1个隐含层,输入层的节点数为l,l=Hc×Wc;第k个隐含层的节点数分别为lk,1≤k≤2r‑1,输出层的节点数和输入层的节点数相同,都为l,网络的参数为各个层的权值和偏置;自编码器的训练过程包含逐层无监督预训练和有监督微调两个阶段,在逐层无监督预训练过程中,从自编码器的输入层到中间层,把相邻两层看作受限玻尔兹曼机,其中每个RBM的输出是上一个相邻RBM的输入,从最底层的RBM开始,逐层对所有RBM进行学习训练;逐层训练完成后,采用有监督的方式,从网络的输出层到输入层,逐层调整网络的参数;第k个RBM的可视层为hk‑1,1≤k≤r,隐含层为自编码器的第k个隐含层hk,RBM的学习过程具体步骤如下:步骤3.1、随机初始化权值矩阵Wk,可视层偏置向量ak和隐含层偏置向量bk为接近于0的数值;步骤3.2、对输入向量hk‑1,计算下面的概率值:P(hki=1|hk-1)=11+e-(Σj=1lk-1wijkhk-1,j+bik),1≤i≤lk]]>随机产生i个0到1之间的随机数βi,将P(hki=1|hk‑1)与对应的βi进行比较,若P(hki=1|hk‑1)大于βi,则令P(hki=1|hk‑1)=1;否则,令P(hki=1|hk‑1)=0;步骤3.3、使用采样得到的P(hki=1|hk‑1),计算下面的概率值,得到可视层的重建P(h^k-1,j=1|hk)=11+e-(Σi=1lkwijkhk,i+ajk),1≤j≤lk-1]]>步骤3.4、使用可视层的重建计算下面的概率值:P(h^ki=1|h^k-1)=11+e-(Σj=1lk-1wijkh^k-1,j+bik),1≤i≤lk]]>步骤3.5、按照下式更新各个参数:Wk←Wk+η(P(hki=1|hk-1)hk-1T-P(h^ki=1|h^k-1)h^k-1T))]]>ak←ak+η(hk-1-h^k-1)]]>bk←bk+η(P(hki=1|hk-1)-P(h^ki=1|h^k-1))]]>式中,η表示学习率,0<η<1;步骤4、依照步骤3,依次学习第1个到第r个RBM;步骤5、将训练后的r个RBM从底向上堆叠,然后以第r个RBM的隐含层作为中间层,将这r个RBM再反向堆叠,得到自编码器,并用步骤4得到的权值和偏置初始化自编码器;步骤6、采用反向传播算法调整自编码器的参数;步骤6.1、对于输入向量x,根据以下公式,计算自编码器各层神经元的激活:h1i=σ(Σj=1lwij1xj+bi1),i=1,2,...,l1;hki=σ(Σj=1nk-1wijkhk-1,j+bik),i=1,2,...,lk,1<k≤2r-1;oi=σ(Σj=1nrwij2r-1h2r-1,j+bi2r-1),i=1,2,...,l;]]>其中,σ(·)为sigmoid函数,σ(x)=1/1+e‑x,表示第1个隐含层第i个节点的偏置,表示第k个隐含层第i个节点的偏置,表示第2r‑1个隐含层第i个节点的偏置,且1≤k≤2r‑1;步骤6.2、目标函数为实际输出向量o与目标输出向量y的交叉熵,用f表示:f=-Σt=1mNΣj=1l(yjt×logojt+(1-yjt)×log(1-ojt))]]>步骤6.3、令1≤k≤2r‑1,1≤t≤mN,计算各代价函数f对的偏导数;计算代价函数f对输出层的偏导数,用表示:δ2rt=Σj=1l(ojt-yjt)]]>对于hk(k=2r‑1,…,1)隐含层,计算代价函数f对各层的偏导:δkt=(Wk+1)Tδk+1tσ′(ukt),1≤k≤2r-1]]>步骤6.4、计算代价函数关于权值和偏置的偏导:∂f∂Wk=Σt=1mNhk-1t(δkt)T∂f∂bk=Σt=1mNδkt,1≤k≤2r-1]]>步骤6.5、利用共轭梯度下降法对权值和偏置进行迭代更新,得到最终的权值和偏置;步骤7、读取测试人脸图像库D2,将测试人脸图像库D2中的侧面人脸图像重建成正面人脸图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410529076.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top