[发明专利]一种基于属性划分的序信息并行约简方法在审
申请号: | 201711060640.1 | 申请日: | 2017-11-02 |
公开(公告)号: | CN107729715A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 莫京兰 | 申请(专利权)人: | 广西科技大学鹿山学院 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京君恒知识产权代理事务所(普通合伙)11466 | 代理人: | 谭月萍,黄启行 |
地址: | 545616 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 属性 划分 信息 并行 方法 | ||
技术领域
本发明涉及粗糙集属性简约领域,尤其涉及一种基于属性划分的序信息 并行约简方法。
背景技术
粗糙集理论作为一种数据分析处理理论,在1982年由波兰科学家 Z.Pawlak提出,是继概率论,模糊集,证据理论之后的又一个处理不确定性 的理论工具。它能有效地对数据进行分析和推理,从不精确,不一致和不完 整信息中发现隐含的知识,揭示潜在的规律。粗糙集近年来越来越受到重视, 是当前国际上人工智能理论及其应用领域中的研究热点之一,其有效性已在 许多科学与工程领域的成功应用中得到证实,由于其在处理不确定、不精确 和不完备信息中的独特优势从而引起智能信息处理工作者的关注,并被成功 应用到机器学习与知识发现、数据挖掘、模式识别、过程控制、临床医疗诊 断、决策分析与支持等领域。在粗糙集理论中,序信息系统的属性约简是一 个重要的问题,目前已取得一些初步的研究成果,但仍缺乏有效的计算方法, 主要表现为求解约简耗时过长,严重影响了约简的可靠性和有效性。
发明内容
本发明的目的在于提供一种基于属性划分的序信息并行约简方法,本发 明对决策系统基于对属性的密度进行划分,进而以此为基础求得决策系统的 超约简和约简,从而缩短了解约简耗时时间,提高了约简的可靠性和有效性, 为了实现上述目的,本发明采用以下技术效果:
根据本发发明的一个方面,提供了一种基于属性划分的序信息并行约简 方法,包括以下步骤:
步骤一:对输入初始化样本集合S=(U,A,V,f)建立决策系统SAi=(U,Ai,VAi,fAi), 并根据决策系统SAi进行密度划分以此形成约简生成属性集;
步骤二:对初始化样本集合形成的约简属性集和决策系统构建不同属性 集的优势类差量,以获取最大决策系统的超约简;
步骤三:逐一检验超约简的属性,按照超约简的属性大小排列,并逐步 向约简属性集插入优势类差量;
步骤四:对超约简的属性进行冗余性检验,输出最终约简的最优解。
优选的,根据决策系统SAi进行密度划分按如下步骤进行:假设在决策系 统SAi中存在一个任意属性分组使得满足:
对于任意的Ai,满足||Ai|-|Aj||≤1,且i≤j,对于给定的属性集合A, 按照其属性原始排列顺序依次获取出其对应的属性个数作为相应划分块的属 性即可得到最佳密度划分。
优选的,所述步骤二对初始化样本集合形成的约简属性集和决策系统构 建不同属性集的优势类差量,其中构建不同属性集的优势类差量按如下步骤 进行:对于决策系统SAi=(U,Ai,VAi,fAi),满足A=C∪D,且C表示属性集 合A的条件属性集,D表示属性集合A的决策属性集,则条件属性集C相对于 属性集B的优势类差量DCI(C,B)满足:
其中|·|表示集合的基数。
本发明采用了上述技术方案,本发明具有以下技术效果:
本发明对决策系统基于对属性的密度进行划分,进而以此为基础求得决 策系统的超约简和约简,可以充分利用多台计算机进行并行计算,在设备充 足的情况下可以极大提高算法的效率,尤其针对大数据集时更为有效.发明 在约简的求取过程中相比于一般利用辨识矩阵的算法而言,具有更低的时间 和空间开销.本发明遵从序关系特性,即自反性、传递性及序对称性,可避 免语义上的矛盾,本发明提出的决策系统优势关系的模型的近似精度及分类 精度更优,从而快速找出决策系统的约简。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下举出优选实施 例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多 细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解,即便 没有这些特定的细节也可以实现本发明的这些方面。
根据本发明的一种基于属性划分的序信息并行约简方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西科技大学鹿山学院,未经广西科技大学鹿山学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711060640.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:PLC编程系统及方法
- 下一篇:可编程显示器、更新处理装置及其方法及记录介质
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置