[发明专利]一种粗集优化神经网络的数据挖掘方法无效

专利信息
申请号: 201010294823.1 申请日: 2010-09-28
公开(公告)号: CN101963983A 公开(公告)日: 2011-02-02
发明(设计)人: 李星 申请(专利权)人: 江苏瑞蚨通软件科技有限公司(中外合资)
主分类号: G06F17/30 分类号: G06F17/30;G06N3/02
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 柏尚春
地址: 212002 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 优化 神经网络 数据 挖掘 方法
【说明书】:

技术领域

发明涉及一种数据挖掘方法,特别是涉及一种利用粗集优化神经网络的数据挖掘方法。

背景技术

随着数据库应用范围的扩展,每天都有海量的数据收集到数据库中,如何快速、准确地提供有效的数据就成为了系统所要解决的首要问题。

粗集理论是一种刻画不完整性和不确定性信息的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。粗集理论以观察和测量所得的数据并进行分类的方法为基础,它认为知识是基于对对象分类的能力,知识直接与真实或抽象世界有关的不同分类模式联系在一起。粗集用上近似、下近似和边界来刻画信息的不确定性。在处理大数据量,消除冗余信息等方面,粗集理论有着良好效果。

神经网络是通过网络中各连接权值的改变,实现信息的处理和存储。在神经网络中每个神经元既是信息的存储单元,又是信息的处理单元,信息的处理与存储合二为一,由这些神经元构成的网络在每个神经元的共同作用下,完成对输入模式的识别与记忆。人工神经网络以神经元间广泛的互连分布来存贮信息,以非线性神经元来协同处理信息。因此,它具有大规模并行处理、极强的鲁棒性和容错性,很强的自学习功能。

目前常用采用以下方式将粗集理论和神经网络结合起来:(1)将粗集作为神经网络的前端处理器;(2)强耦合方式:即先用粗集分析决策表得到初始规则,然后用神经网络精化;(3)粗神经网络:在普通BP网的输入层和隐层之间加一个粗神经元(全互连接),以抑制输入层数据的波动;(4)用粗集优化神经网络的结构。除上述结合模式外,还存在许多新的集成方式。

在现行的各种结合方式中,粗集理论的属性约简是其中的重要组成部分之一,通过用其对神经网络的训练数据进行约简,减少网络学习所需数据量,达到进一步改善神经网络学习效率和精度的目的。但在实际应用中,对于一些规模较大的网络,粗集的处理效率仍然相对较低。

发明内容

发明目的:本发明的目的在于针对现有技术的不足,提供一种对数据的处理效率更高的利用粗集优化神经网的数据挖掘方法。

技术方案:一种粗集优化神经网络的数据挖掘方法,包括以下步骤:a、对样本数据进行分析,根据已知的领域知识形成一个初始的连续属性决策表;b、采用离散方法对连续属性进行离散化以形成离散属性决策表,即采用量化后的条件属性和决策属性值形成一张二维表格,每一行描述一个对象,每一列对应对象的一种属性;c、对离散属性决策表进行约简,对决策表约简的过程,就是从决策表系统的条件属性中去掉不必要的的条件属性,从而分析所得到约简中的条件属性对于决策属性的决策规则;d、利用神经网络对数据进行训练、挖掘。

较佳的,步骤c通过以下方法实现:用基于遗传算法的并行约简算法对数据进行属性约简,以约简后的属性作为输入层神经元,然后对数据进行垂直约简,以消除数据中的不一致对象和冗余对象。

较佳的,所述属性约简采用以下流程:

输入:条件属性集合C={Y11,Y12,……,Y53},决策属性集合D={d};

输出:一个属性约简集合REDU;

步骤1:计算条件属性C有D正域POSC(D);

步骤2:对属性Yij∈C,计算去除它所得到的条件属性子集C/{Yij}的D正域POSc/{Yij}(D);

步骤3:如果POSc/{Yij}(D)=POSC(D),则说明属性Yij对于决策属性d是不必要的,这时C=C/{Yij},转步骤2;否则,输出属性约简REDU=C。

较佳的,所述不一致对象为条件属性相同而决策属性不同的对象,所述冗余对象为条件属性相同而决策属性也相同的对象。

用粗集方法对数据进行分析前,需要将连续变量离散化,离散化本质上可归结为利用选取的断点来对条件属性构成的空间进行划分的问题,把n维空间划分成有限个区域,使得每个区域中的对象的决策值相同。较佳的,步骤b中采用距离划分方法或等频率划分方法或Naive Scaler方法使连续属性进行离散化。

神经网络按类型可分为BP网络、ART网络、RBF网络和LVM网络,较佳的,所述神经网络为BP网络,即多层前馈网络。多层前馈网络,前馈是从网络结构上来说的,是前一层神经元单向馈入后一层神经元,而后面的神经元没有反馈到之前的神经元;而BP网络是从网络的训练方法上来说的,是指该网络的训练算法是反向传播算法,即神经元的链接权重的训练是从最后一层(输出层)开始,然后反向依次更新前一层的链接权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏瑞蚨通软件科技有限公司(中外合资),未经江苏瑞蚨通软件科技有限公司(中外合资)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010294823.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top