[发明专利]一种基于叠加卷积稀疏自编码机的表示学习方法有效
申请号: | 202010581332.9 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111753898B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 朱毅;李云;强继朋;袁运浩 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06F18/21 | 分类号: | G06F18/21;G06F18/214;G06F18/241;G06F18/2136;G06F18/213;G06N20/00 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 董旭东;陈栋智 |
地址: | 225000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 叠加 卷积 稀疏 编码 表示 学习方法 | ||
1.一种基于叠加卷积稀疏自编码机的表示学习方法,其特征在于,包括以下步骤:
步骤1)设计和实现包括白化的重构独立成分分析算法,并将图像数据集作为输入,迭代优化学习其输出的重构矩阵,得到训练完成的稀疏自编码模型;所述步骤1)具体包括:
步骤1-1)将输入图像数据集表示为{(x1,y1),...,(xnl,ynl),(xnl+1),...,(xn)},其中n是图像数据集所有数据的数量,yi∈{1,2,...,c}是数据标签集,nl是有标签的数据数量,c是标签的数量;先对数据进行白化处理,计算输入数据的协方差矩阵再计算出协方差矩阵的特征向量,按列组成矩阵U如下公式所示:
矩阵U中,u1是主特征向量,其对应最大的特征值,u2是次特征向量,以此类推,并记λ1,λ2,...,λn为矩阵U中各向量相应的特征值;
步骤1-2)用计算出的矩阵U表示输入数据如下公式所示:
其中下标rot表示由原数据经过PCA旋转处理后所得到的结果,使用作为缩放因子来缩放每个特征xrot,i,从而得到PCA白化后的数据表示如下公式所示:
步骤1-3)设R是任意正交矩阵,满足RRT=RTR=I,那么RxPCAwhite仍然具有单位协方差,令R=U,得到公式(1):
xZCAwhite=UxPCAwhite (1),
xZCAwhite即ZCA白化后得到的原始输入数据的处理数据;
步骤1-4)设计重构独立成分分析算法,将公式(1)获得的xZCAwhite作为输入代入代价函数如公式(2)得到:
其中,W为加权矩阵,WT为W的转置矩阵,WxZCAwhite代表输入xZCAwhite的特征表示,λ为超参数;
步骤1-5)对代价函数式(2)求关于xZCAwhite的偏导,其中对代价函数式(2)的第一项求偏导时,采用作为偏导函数;代价函数式(2)的偏导函数如式(3)所示:
其中ε是一个极小的常数;
步骤1-6)利用L-FBGS算法,迭代计算加权矩阵W,得到训练完成的稀疏自编码模型;
步骤2)构建半监督叠加稀疏自编码机模型对特征表示做训练;所述步骤2)具体包括:
步骤2-1)构建半监督叠加稀疏自编码机模型,将步骤1-6)得到的加权矩阵W代入代价函数式(2)中,得到的输出记为xfea,半监督叠加稀疏自编码机的目标函数如公式(4)所示:
公式(4)中,α和γ是超参数,用以控制式(4)中三项的平衡,表示半监督叠加稀疏自编码机的输出,WSSL和bSSL分别表示半监督学习中的权重矩阵和偏置向量,ξl表示有标签数据隐藏层的输出;
表示从xfea到特征提取后重新表示的数据之间的重构误差,其中β是控制稀疏惩罚项权重的超参数,s表示隐藏层节点的数量,是用以做稀疏惩罚项的KL距离,其中p是稀疏参数,是隐藏层节点r的平均激活值;
表示根据数据标签做的多类回归偏置项,其中n是图像数据集所有数据的数量,yi∈{1,2,...,c}是数据标签,ξil表示第i个有标签数据第l层隐藏层的输出;
表示权重矩阵WSSL和偏置向量bSSL的约束项;
步骤2-2)迭代求解半监督叠加稀疏自编码机,关于权重矩阵WSSL和偏置向量bSSL的偏导数计算公式如下:
表示从xfea到输出特征之间的重构误差,其中δ(l+1)表示重构误差关于bSSL的偏导,表示为:其中zi(l+1)=WSSL(l+1)xi+bSSL(l+1);
J2(WSSL,ξl)是根据数据标签做的多类回归偏置项,定义则J2关于权重矩阵WSSL偏导数的计算公式如下所示:
J3(WSSL,bSSL)表示权重矩阵WSSL和偏置向量bSSL的约束项,其关于WSSL和bSSL的偏导数计算公式如下所示:
步骤3)构建卷积模型从数据中提取块特征,应用卷积和池化操作生成卷积特征表示;所述步骤3)具体包括:
步骤3-1)构建卷积模型从数据中提取块特征,步骤2-2)得到的xfea表示为其中c表示图像数据通道数量,m1和m2是图像数据的高和宽;在xfea中提取块特征来组成训练集,其中n1和n2是P的大小,K是P的数量,n1×n2×c是卷积核的大小,将每个输入数据都映射到(n1×n2×c)×1中去;
步骤3-2)对卷积特征做平均池化优化特征表示,在步骤3-1)获取到卷积块特征P的基础上,对P做归一化,目标函数如公式(5)所示:
其中mean(P)是P的均值,var(P)是P的方差;利用随机梯度下降方法,在m1×m2的图像大小上,对卷积特征做池化,即使用卷积的方法,对归一化的卷积块特征P,求整个图像范围内的卷积特征xpooled;
步骤4)将卷积稀疏自编码机进行叠加,对卷积特征表示进行进一步优化;
步骤5)在最终学习得到的特征表示的基础上,用逻辑回归模型在图像数据集上训练分类器,并得到分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010581332.9/1.html,转载请声明来源钻瓜专利网。