[发明专利]一种基于迭代的神经网络聚类方法在审

申请号：	201510885998.2	申请日：	2015-12-06
公开（公告）号：	CN105550744A	公开（公告）日：	2016-05-04
发明（设计）人：	段立娟;袁彬;崔嵩;苗军;刘军发	申请（专利权）人：	北京工业大学
主分类号：	G06N3/08	分类号：	G06N3/08;G06N99/00
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	刘萍
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于神经网络方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明主要用于解决机器学习中经典的聚类问题，使用方法涉及到由人工神经网络改进的超限学习机算法。

背景技术

对数据的聚类问题一直以来都是工业系统与计算科学中的重要研究内容。在这个信息量爆炸的大数据时代，数据处理相关的业务需求日益增多，所要处理的数据也越来越复杂。随着人们对聚类问题的深入研究，不断有新的聚类方法被提取。传统聚类算法如K均值算法、最大期望算法以及层次聚类算法等，聚类速度快但仅适用于数据空间线性可分情况的。新兴的聚类算法如谱聚类算法、深度学习自编码器、非监督超限学习机等，可以解决数据空间高维且线性不可分的情况，但通常需要消耗较大的内存或需要较长的运行时间。

目前，对于大规模复杂数据的聚类，既需要聚类算法有处理高维线性不可分数据的能力，也需要解决内存与运行成本。本发明利用神经网络来解决聚类问题，使得该方法能够有效地处理高维非线性复杂数据。并且引入超限学习机模型来求解神经网络，打打提升了算法的运行速度。超限学习机，英文名为ExtremeLearningMachine，是黄广斌教授于 2004年提出的针对单隐层前馈神经网络的学习方法。与传统神经网络优化的梯度下降算法不同，超限学习机的学习过程不需要迭代操作，这大大减少了它的训练时间。此外，本方法以K均值算法为基本框架，便于使用并行化的加速手段来减少聚类的时间消耗。并且使用超限学习机的神经网络模型以及仅用少量榜样集进行训练的策略，因此该方法只需要较短的计算时间与较少的内存消耗。

综合来讲，本发明既解决了传统聚类方法不能很好处理高维非线性数据空间聚类的问题，又解决了新兴聚类算法内存消耗大和运行时间长的问题，使得本方法能够有效地处理大规模复杂数据的聚类问题。

发明内容

本发明的目的在于提供一种基于迭代的神经网络聚类算法，本发明基于传统聚类的框架，通过引入神经网络作为相似度衡量的依据，并通过不断优化网络结构得到更准确的相似度衡量标准。

本发明提出一种基于迭代的神经网络聚类算法包括以下步骤：

步骤1，初始化超限学习机模型参数；

步骤2，随机选取与所要聚类个数相同数量的样本，每个样本代表一个聚类，训练超限学习机以得到初始的隐层到输出层间权值；

步骤3，利用当前的超限学习机模型对样本进行聚类分组；

步骤4，对于每一个聚类分组，根据规则选取多个样本作为该聚类分组的榜样；

步骤5，使用上个步骤中得到各聚类分组的榜样样本来重新训练超限学习机模型；

步骤6，若满足结束条件则输出聚类分组结果，否则返回步骤3。

进一步，步骤1共包括以下2个子步骤：

步骤1.1，设置超限学习机模型的隐层神经元个数L、隐层的激活函数g(θ)以及正则项系数γ；