[发明专利]基于自编码器的人脸图像旋转方法有效

申请号：	201410529076.3	申请日：	2014-10-09
公开（公告）号：	CN104298973B	公开（公告）日：	2018-03-30
发明（设计）人：	李玉鑑;郝利刚;张婷	申请（专利权）人：	北京工业大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	北京思海天达知识产权代理有限公司11203	代理人：	沈波
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于自编码器的人脸图像旋转方法，依次包括以下步骤首先，采集每一位用户的原始正面和侧面人脸图像，并通过手工方式选取包含人脸的区域构成纯人脸图像，并以此作为用户人脸图像的模板；然后，将模板库中的彩色图像转换成灰度图像；其次，从自编码器的输入层到中间层，将相邻两层看作RBM，逐层训练每个RBM。将训练后RBM堆叠得到自编码器，并用训练RBM得到的权值和偏置作为自编码器的初始化权值和偏置；再次，使用反向传播算法逐层调整自编码器各层的权值和偏置；最后，使用新用户的侧面人脸图像，对训练过的自编码器进行测试，将侧面图像重建成正面人脸图像。该方法重建过程更加智能化。
搜索关键词：	基于编码器图像旋转方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于自编码器的人脸旋转方法，其特征在于：该方法依次包括以下步骤，步骤1、建立人脸图像模板库，定义有N个用户，使用图像采集设备，为每一个用户拍摄正面和侧面原始人脸图像，拍摄侧面图像时，让人脸以正前方为基准，旋转一定角度进行拍摄；设人脸旋转的角度为α，‑45°≤α≤45°；获得原始人脸图像后，手工选择图像中只包含人脸部分构成纯人脸图像，每个用户选一张正面图像作为目标图像模板和m张侧面图像作为侧面图像模板，第c个用户的正面图像和侧面图像分别用Pc和表示，1≤c≤N，1≤m≤100，(c‑1)m+1≤t≤cm，用Hc和Wc分别表示正面图像的高和宽，和分别表示侧面图像的高和宽，用表示N个用户的纯人脸图像模板库，把N个用户的人脸图像模板SOF分成两部分，一部分为训练人脸库D1，包含每个用户的一幅正面图像和m幅侧面图像，用于训练自编码器；剩余用户的正面图像和侧面图像作为测试人脸库D2，用于测试训练后的自编码器；步骤2、如果纯人脸图像模板是彩色图像，则首先将彩色图像转换成灰度图像，用Rc(h,w)、Gc(h,w)和Bc(h,w)分别表示第c个用户正面人脸图像中第(h,w)个像素的红色分量、绿色分量和蓝色分量，根据著名灰度化心理学公式计算其灰度值如下：gc(h,w)＝(Rc(h,w)×299+Gc(h,w)×587+Bc(h,w)×114+500)/1000灰度化后的人脸图像分别用表示；步骤3、使用训练人脸库D1中每个用户经过灰度化后的侧面图像为训练图像，每个用户对应的灰度化后的正面图像为目标输出，训练自编码器；定义自编码器包含2r‑1个隐含层，输入层的节点数为l，l＝Hc×Wc；第k个隐含层的节点数分别为lk，1≤k≤2r‑1，输出层的节点数和输入层的节点数相同，都为l，网络的参数为各个层的权值和偏置；自编码器的训练过程包含逐层无监督预训练和有监督微调两个阶段，在逐层无监督预训练过程中，从自编码器的输入层到中间层，把相邻两层看作受限玻尔兹曼机，其中每个RBM的输出是上一个相邻RBM的输入，从最底层的RBM开始，逐层对所有RBM进行学习训练；逐层训练完成后，采用有监督的方式，从网络的输出层到输入层，逐层调整网络的参数；第k个RBM的可视层为hk‑1，1≤k≤r，隐含层为自编码器的第k个隐含层hk，RBM的学习过程具体步骤如下：步骤3.1、随机初始化权值矩阵Wk，可视层偏置向量ak和隐含层偏置向量bk为接近于0的数值；步骤3.2、对输入向量hk‑1，计算下面的概率值：P(hki=1|hk-1)=11+e-(Σj=1lk-1wijkhk-1,j+bik),1≤i≤lk]]>随机产生i个0到1之间的随机数βi，将P(hki＝1|hk‑1)与对应的βi进行比较，若P(hki＝1|hk‑1)大于βi，则令P(hki＝1|hk‑1)＝1；否则，令P(hki＝1|hk‑1)＝0；步骤3.3、使用采样得到的P(hki＝1|hk‑1)，计算下面的概率值，得到可视层的重建P(h^k-1,j=1|hk)=11+e-(Σi=1lkwijkhk,i+ajk),1≤j≤lk-1]]>步骤3.4、使用可视层的重建计算下面的概率值：P(h^ki=1|h^k-1)=11+e-(Σj=1lk-1wijkh^k-1,j+bik),1≤i≤lk]]>步骤3.5、按照下式更新各个参数：Wk←Wk+η(P(hki=1|hk-1)hk-1T-P(h^ki=1|h^k-1)h^k-1T))]]>ak←ak+η(hk-1-h^k-1)]]>bk←bk+η(P(hki=1|hk-1)-P(h^ki=1|h^k-1))]]>式中，η表示学习率，0＜η＜1；步骤4、依照步骤3，依次学习第1个到第r个RBM；步骤5、将训练后的r个RBM从底向上堆叠，然后以第r个RBM的隐含层作为中间层，将这r个RBM再反向堆叠，得到自编码器，并用步骤4得到的权值和偏置初始化自编码器；步骤6、采用反向传播算法调整自编码器的参数；步骤6.1、对于输入向量x，根据以下公式，计算自编码器各层神经元的激活：h1i=σ(Σj=1lwij1xj+bi1),i=1,2,...,l1;hki=σ(Σj=1nk-1wijkhk-1,j+bik),i=1,2,...,lk,1<k≤2r-1;oi=σ(Σj=1nrwij2r-1h2r-1,j+bi2r-1),i=1,2,...,l;]]>其中，σ(·)为sigmoid函数，σ(x)＝1/1+e‑x，表示第1个隐含层第i个节点的偏置，表示第k个隐含层第i个节点的偏置，表示第2r‑1个隐含层第i个节点的偏置，且1≤k≤2r‑1；步骤6.2、目标函数为实际输出向量o与目标输出向量y的交叉熵，用f表示：f=-Σt=1mNΣj=1l(yjt×logojt+(1-yjt)×log(1-ojt))]]>步骤6.3、令1≤k≤2r‑1,1≤t≤mN，计算各代价函数f对的偏导数；计算代价函数f对输出层的偏导数，用表示：δ2rt=Σj=1l(ojt-yjt)]]>对于hk(k＝2r‑1,…,1)隐含层，计算代价函数f对各层的偏导：δkt=(Wk+1)Tδk+1tσ′(ukt),1≤k≤2r-1]]>步骤6.4、计算代价函数关于权值和偏置的偏导：∂f∂Wk=Σt=1mNhk-1t(δkt)T∂f∂bk=Σt=1mNδkt,1≤k≤2r-1]]>步骤6.5、利用共轭梯度下降法对权值和偏置进行迭代更新，得到最终的权值和偏置；步骤7、读取测试人脸图像库D2，将测试人脸图像库D2中的侧面人脸图像重建成正面人脸图像。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410529076.3/，转载请声明来源钻瓜专利网。

上一篇：基于多传感器的人体肢体微动作识别装置
下一篇：家用设备状态识别方法、系统及移动终端

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于自编码器的人脸图像旋转方法有效

专利文献下载