[发明专利]一种基于栈式降噪自编码神经网络的数据约简方法在审

专利信息
申请号: 201811476554.3 申请日: 2018-12-05
公开(公告)号: CN109598336A 公开(公告)日: 2019-04-09
发明(设计)人: 肖子洋;邱日轩;付晨;李路明;褚红亮 申请(专利权)人: 国网江西省电力有限公司信息通信分公司;国家电网有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08;G06N20/00
代理公司: 南昌新天下专利商标代理有限公司 36115 代理人: 施秀瑾
地址: 330077 *** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 自编码 降噪 约简 栈式 神经网络 微调 神经网络算法 初始参数 分类效果 机器学习 模型构建 输入样本 学习算法 运算成本 分类器 复杂度 高效性 交叉熵 特征集 最小化 降维 重构 样本 并用 验证 输出 应用 改进 网络 保证
【说明书】:

发明公开了一种基于栈式降噪自编码神经网络的数据约简方法,其特征在于,栈式降噪自编码神经网络的约简模型构建步骤如下:步骤1:将前一个DAE的输出,作为下一个DAE的输入,以此来达到层层编码的目的;步骤2:用来表示原始的输入样本,并用来代表第i层的DAE的编码情况,可以得出每一层的DAE的编码情况;进行逐层贪婪训练及微调,微调过程通过BP算法调整初始参数的交叉熵函数以保证重构误差的最小化。本发明采用降噪自编码网络的改进方法‑栈式降噪自编码神经网络算法对样本特征集进行降维,以降低各类模型的复杂度,提高及机器学习应用中分类器的分类效果,减少各类学习算法的运算成本,并对该方法约简的可行性和高效性进行了验证。

技术领域

本发明涉及数据处理技术领域,特别涉及一种基于栈式降噪自编码神经网络的数据约简方法。

背景技术

自编码器(Autoencoder,AE)是由Hinton于2006年提出的,其结构分为输入层,输出层,及其隐含层。输入层和输出层神经元数量相同,隐含层神经元数量较少,其中输入层和隐含层构成编码网络部分,AE在编码网络部分压缩数据。

目前,随着数据采集、存储技术的快速发展,数据冗余的问题越来越严重,它不仅极大地浪费存储空间,也会显著降低基于数据的建模。

针对海量数据集的维度高、冗余度大,指标间关联性较强的特点,为提高对数据处理能力和数据可用性,需要提出一种新型方法对原始数据进行预处理。

发明内容

发明的目的在于提供一种基于栈式降噪自编码神经网络的数据约简方法,本发明采用降噪自编码网络的改进方法-栈式降噪自编码神经网络算法对样本特征集进行降维,以降低各类模型的复杂度,提高及机器学习应用中分类器的分类效果,减少各类学习算法的运算成本,并对该方法约简的可行性和高效性进行了验证,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种基于栈式降噪自编码神经网络的数据约简方法,通过qD,原始数据X被扰乱成,并将此带有噪声的数据作为自编码器的输入,通过fθ,对隐藏层各个神经元的激活值进行计算,栈式降噪自编码神经网络的约简模型构建步骤如下:

步骤1:将前一个DAE的输出,作为下一个DAE的输入,以此来达到层层编码的目的;

步骤2:用x0来表示原始的输入样本,并用xi来代表第i层的DAE的编码情况,可以得出每一层的DAE的编码情况,其表示方式如下:

xi=fθ(xi-1)i=1,2,3,…。

步骤3:进行逐层贪婪训练及微调,其中,逐层贪婪训练过程通过最小化原始输入数据与重构编码的差异训练权重,得到初始参数,微调过程通过BP算法调整初始参数的交叉熵函数以保证重构误差的最小化,以得到最优重构效果的目的。

进一步地,训练由多层DAE构成的SDAE时,需要采用逐层贪婪的原则,对每一层DAE进行单独训练得到初始化参数,并在保证重构误差最小化的基础上对参数进行微调。

进一步地,其包括如下步骤:先利用输入的样本特征训练SDAE的第一层,即第一个DAE,并通过微调得到相应的参数,然后将该DAE的隐含层输出作为第二个DAE的输入,训练并微调得到第二个DAE的参数,依次下去,便可以得到基于SDAE的约简模型。

进一步地,在整个训练过程中,训练下一个DAE时要保证上一个DAE的参数不变。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江西省电力有限公司信息通信分公司;国家电网有限公司,未经国网江西省电力有限公司信息通信分公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811476554.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top