[发明专利]基于自编码器的人脸图像旋转方法有效
申请号: | 201410529076.3 | 申请日: | 2014-10-09 |
公开(公告)号: | CN104298973B | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 李玉鑑;郝利刚;张婷 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于自编码器的人脸图像旋转方法,依次包括以下步骤首先,采集每一位用户的原始正面和侧面人脸图像,并通过手工方式选取包含人脸的区域构成纯人脸图像,并以此作为用户人脸图像的模板;然后,将模板库中的彩色图像转换成灰度图像;其次,从自编码器的输入层到中间层,将相邻两层看作RBM,逐层训练每个RBM。将训练后RBM堆叠得到自编码器,并用训练RBM得到的权值和偏置作为自编码器的初始化权值和偏置;再次,使用反向传播算法逐层调整自编码器各层的权值和偏置;最后,使用新用户的侧面人脸图像,对训练过的自编码器进行测试,将侧面图像重建成正面人脸图像。该方法重建过程更加智能化。 | ||
搜索关键词: | 基于 编码器 图像 旋转 方法 | ||
【主权项】:
一种基于自编码器的人脸旋转方法,其特征在于:该方法依次包括以下步骤,步骤1、建立人脸图像模板库,定义有N个用户,使用图像采集设备,为每一个用户拍摄正面和侧面原始人脸图像,拍摄侧面图像时,让人脸以正前方为基准,旋转一定角度进行拍摄;设人脸旋转的角度为α,‑45°≤α≤45°;获得原始人脸图像后,手工选择图像中只包含人脸部分构成纯人脸图像,每个用户选一张正面图像作为目标图像模板和m张侧面图像作为侧面图像模板,第c个用户的正面图像和侧面图像分别用Pc和表示,1≤c≤N,1≤m≤100,(c‑1)m+1≤t≤cm,用Hc和Wc分别表示正面图像的高和宽,和分别表示侧面图像的高和宽,用表示N个用户的纯人脸图像模板库,把N个用户的人脸图像模板SOF分成两部分,一部分为训练人脸库D1,包含每个用户的一幅正面图像和m幅侧面图像,用于训练自编码器;剩余用户的正面图像和侧面图像作为测试人脸库D2,用于测试训练后的自编码器;步骤2、如果纯人脸图像模板是彩色图像,则首先将彩色图像转换成灰度图像,用Rc(h,w)、Gc(h,w)和Bc(h,w)分别表示第c个用户正面人脸图像中第(h,w)个像素的红色分量、绿色分量和蓝色分量,根据著名灰度化心理学公式计算其灰度值如下:gc(h,w)=(Rc(h,w)×299+Gc(h,w)×587+Bc(h,w)×114+500)/1000灰度化后的人脸图像分别用表示;步骤3、使用训练人脸库D1中每个用户经过灰度化后的侧面图像为训练图像,每个用户对应的灰度化后的正面图像为目标输出,训练自编码器;定义自编码器包含2r‑1个隐含层,输入层的节点数为l,l=Hc×Wc;第k个隐含层的节点数分别为lk,1≤k≤2r‑1,输出层的节点数和输入层的节点数相同,都为l,网络的参数为各个层的权值和偏置;自编码器的训练过程包含逐层无监督预训练和有监督微调两个阶段,在逐层无监督预训练过程中,从自编码器的输入层到中间层,把相邻两层看作受限玻尔兹曼机,其中每个RBM的输出是上一个相邻RBM的输入,从最底层的RBM开始,逐层对所有RBM进行学习训练;逐层训练完成后,采用有监督的方式,从网络的输出层到输入层,逐层调整网络的参数;第k个RBM的可视层为hk‑1,1≤k≤r,隐含层为自编码器的第k个隐含层hk,RBM的学习过程具体步骤如下:步骤3.1、随机初始化权值矩阵Wk,可视层偏置向量ak和隐含层偏置向量bk为接近于0的数值;步骤3.2、对输入向量hk‑1,计算下面的概率值:P(hki=1|hk-1)=11+e-(Σj=1lk-1wijkhk-1,j+bik),1≤i≤lk]]>随机产生i个0到1之间的随机数βi,将P(hki=1|hk‑1)与对应的βi进行比较,若P(hki=1|hk‑1)大于βi,则令P(hki=1|hk‑1)=1;否则,令P(hki=1|hk‑1)=0;步骤3.3、使用采样得到的P(hki=1|hk‑1),计算下面的概率值,得到可视层的重建P(h^k-1,j=1|hk)=11+e-(Σi=1lkwijkhk,i+ajk),1≤j≤lk-1]]>步骤3.4、使用可视层的重建计算下面的概率值:P(h^ki=1|h^k-1)=11+e-(Σj=1lk-1wijkh^k-1,j+bik),1≤i≤lk]]>步骤3.5、按照下式更新各个参数:Wk←Wk+η(P(hki=1|hk-1)hk-1T-P(h^ki=1|h^k-1)h^k-1T))]]>ak←ak+η(hk-1-h^k-1)]]>bk←bk+η(P(hki=1|hk-1)-P(h^ki=1|h^k-1))]]>式中,η表示学习率,0<η<1;步骤4、依照步骤3,依次学习第1个到第r个RBM;步骤5、将训练后的r个RBM从底向上堆叠,然后以第r个RBM的隐含层作为中间层,将这r个RBM再反向堆叠,得到自编码器,并用步骤4得到的权值和偏置初始化自编码器;步骤6、采用反向传播算法调整自编码器的参数;步骤6.1、对于输入向量x,根据以下公式,计算自编码器各层神经元的激活:h1i=σ(Σj=1lwij1xj+bi1),i=1,2,...,l1;hki=σ(Σj=1nk-1wijkhk-1,j+bik),i=1,2,...,lk,1<k≤2r-1;oi=σ(Σj=1nrwij2r-1h2r-1,j+bi2r-1),i=1,2,...,l;]]>其中,σ(·)为sigmoid函数,σ(x)=1/1+e‑x,表示第1个隐含层第i个节点的偏置,表示第k个隐含层第i个节点的偏置,表示第2r‑1个隐含层第i个节点的偏置,且1≤k≤2r‑1;步骤6.2、目标函数为实际输出向量o与目标输出向量y的交叉熵,用f表示:f=-Σt=1mNΣj=1l(yjt×logojt+(1-yjt)×log(1-ojt))]]>步骤6.3、令1≤k≤2r‑1,1≤t≤mN,计算各代价函数f对的偏导数;计算代价函数f对输出层的偏导数,用表示:δ2rt=Σj=1l(ojt-yjt)]]>对于hk(k=2r‑1,…,1)隐含层,计算代价函数f对各层的偏导:δkt=(Wk+1)Tδk+1tσ′(ukt),1≤k≤2r-1]]>步骤6.4、计算代价函数关于权值和偏置的偏导:∂f∂Wk=Σt=1mNhk-1t(δkt)T∂f∂bk=Σt=1mNδkt,1≤k≤2r-1]]>步骤6.5、利用共轭梯度下降法对权值和偏置进行迭代更新,得到最终的权值和偏置;步骤7、读取测试人脸图像库D2,将测试人脸图像库D2中的侧面人脸图像重建成正面人脸图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410529076.3/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序