[发明专利]基于多维泰勒网的人脸识别方法在审
申请号: | 202011533736.7 | 申请日: | 2020-12-21 |
公开(公告)号: | CN112597890A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 郭金金;胡尘;李明媚;文成林;徐晓滨 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多维 泰勒 识别 方法 | ||
1.基于多维泰勒网的人脸识别方法,其特征在于该方法具体包括以下各步骤:
步骤(1)搭建BP神经网络结构
对网络的参数初始化,包括输入层节点数,隐含层节点数,输出层节点数,并初始化输入层到隐含层以及隐含层到输出层的权重和偏置,选用隐含层的激活函数g(x)为Sigmoid函数,再利用反向传播更新网络权重以及偏置;
步骤(2)搭建多维泰勒网
首先对神经网络激活函数进行泰勒展开,其次对激活函数的泰勒展开进行线性组合得到网络输出,最终通过最小化损失函数得到目标函数最优解;具体步骤如下:
步骤(2-1)神经网络激活函数的泰勒展开
设多维泰勒网的输入层有n个节点,数据处理层有N(n,m)个节点,数据处理层实现对输入变量的各幂次乘积项进行加权求和;
对神经网络激活函数g(x)进行泰勒展开,其中x表示样本数据
将激活函数泰勒展开进行一般性描述,其中o(xn)表示展开后的佩亚若余项;
g(x)=a0+a1x+a2x2+...+anxn+o(xn) (3)
步骤(2-2)多维泰勒网的构建
网络输入为x(k)={x1(k),x2(k),...xn(k)}T,网络输出为y(k),期望输出Y(k),利用神经网络激活函数的泰勒展开后代替原始激活函数,此时数据处理层第j个节点输出为Hj;
其中N(n,m)表示n元多项式m次幂展开后对应的多项式项数,αi=1,2,...n,ωt为t幂次乘积项对应的系数,且α1+α2+...αn=t;
通过对数据处理层的输出进行线性组合得到网络输出y(k),组合系数为βj
将式(5)转换为式(6),将数据处理层看成有N(n,m)个节点,数据处理层与输出层之间的权重矩阵为表示第t个变量乘积项前的权值;
将多维泰勒网的网络输出模型转化为矩阵形式,对权重矩阵的训练过程不再采用梯度下降法的反向传播,而是通过最小化损失函数得到,根据线性代数知识可得目标函数的最优解;
ω=H+Y(k) (9)
其中,H表示数据处理层输出矩阵,H+表示其伪逆矩阵;
步骤(3)将ORL人脸数据库分为训练集和测试集,同时对人脸数据进行矢量化操作,分别利用PCA以及2DPCA算法进行特征提取,并作为网络结构的输入;具体计算过程如下:
步骤(3-1)分离训练集与测试集:ORL人脸数据库包含40个人,每人包含10张人脸图片,每张图片的尺寸为112*92;假设随机取每个人中的n(n≤9)张图片作为训练数据集Xtrain,剩余的作为测试数据集Xtest;
步骤(3-2)对训练数据集去均值化处理;即所有样本减去样本均值M,并得到去平均后的训练集
步骤(3-3)计算去平均后的训练数据集的协方差矩阵COVK*K,以及其特征值λ1,λ2,…,λK,并计算特征向量α1,α2,…,αK,取前r个特征向量组成投影矩阵P;
步骤(3-4)将原始样本投影到映射空间中;
步骤(3-5)2DPCA算法提取特征脸:直接通过对图像样本累加求出映射矩阵,其中对图像矩阵行保持不变,对图像矩阵列降到R维;
步骤(4)载入ORL人脸数据集,利用PCA以及2DPCA算法进行特征提取并作为多维泰勒网络的输入进行人脸识别测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011533736.7/1.html,转载请声明来源钻瓜专利网。