[发明专利]一种基于MPI并行将连续属性进行离散化的方法在审
申请号: | 201711164678.3 | 申请日: | 2017-11-21 |
公开(公告)号: | CN107958266A | 公开(公告)日: | 2018-04-24 |
发明(设计)人: | 胡峰;胡宗容;刘柯;张清华;高延雨;邓维斌;于洪;邓欣;张其龙;欧阳卫华 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F9/54 |
代理公司: | 重庆市恒信知识产权代理有限公司50102 | 代理人: | 刘小红 |
地址: | 400065 重*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 mpi 行将 连续 属性 进行 离散 方法 | ||
1.一种基于MPI并行将连续属性进行离散化的方法,其特征在于,包括以下步骤:
1)、首先,读取信息系统的数据,将信息系统水平划分为m个样本数据子集,通过通信分配给n个节点;2)、其次,每个节点并行对数据进行归一化处理,得到新的数据,再并行对新数据属性进行聚类,通过通信合并聚类结果;3)、最后根据聚类结果进行区间划分,并对不同的区间进行属性编码,从而得到连续属性离散化的结果,构造出属性离散化后的信息系统,再利用粗糙集知识进行属性约简。
2.根据权利要求1所述的基于MPI并行将连续属性进行离散化的方法,其特征在于,所述步骤1)的信息系统包含条件属性和决策属性,数据集的条件属性集,形式为{条件属性1,条件属性2,……条件属性p},信息系统是一个四元组IS=(U,A,V,f),其中U表示领域问题中所有对象的集合,称为论域;A=C∪D是属性集合,子集C和D分别表示条件属性集和决策属性集;
Va是属性a的值域;f:U×A→V是一个信息函数,对一个对象的每一个属性赋予一个信息值,即x∈U,有f(x,a)∈Va。
3.根据权利要求1或2所述的基于MPI并行将连续属性进行离散化的方法,其特征在于,所述步骤1)任务分配时,基于MPI进行并行程序设计时可以根据各节点间的相互关系将其分为对等程序设计模型和主从程序设计模型,采用对等程序设计模型进行程序设计时,各个节点相互协同共同完成任务,节点间不相互依赖;采用主从程序设计模型时,分为主节点和从节点,主节点负责分配计算任务,协调从节点进度和收集计算结果,从节点接收相应的任务并计算,协同完成任务。
4.根据权利要求3所述的基于MPI并行将连续属性进行离散化的方法,其特征在于,所述归一化方法采用min-max法,也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0,1]之间,转换函数如下:
其中max为样本数据的最大值,min为样本数据的最小值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711164678.3/1.html,转载请声明来源钻瓜专利网。