[发明专利]一种知识抽取的方法无效
申请号: | 201210157204.7 | 申请日: | 2012-05-18 |
公开(公告)号: | CN102663142A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 刘洪波;冯士刚;陈荣;张维石 | 申请(专利权)人: | 大连海事大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李洪福 |
地址: | 116026 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 抽取 方法 | ||
技术领域
本发明涉及一种知识发现技术,特别是一种知识抽取方法。
背景技术
粗糙集理论是一种处理不精确、不一致与不完全数据的数学工具,它是波兰科学家Pawlak于1982年提出的,能在保持分类能力不变的前提下,通过知识约简获得知识的分类规则。与决策树、贝叶斯方法等相比,粗糙集方法不需要先验知识,仅利用数据本身所提供的信息系统中发现知识。在真实世界中,许多信息系统的知识体现通常并不唯一,有多个角度的知识,它们可能是信息系统中的不同属性的多个不同组合,其分类性能相当。这些多体知识在特定的环境中,将可能发挥不同的作用。例如,在多机器人实时路径选择中,内存记忆体容量足够的情况下,多体知识提供更多的路径选择,能够表现出更强的回避障碍能力。对于知识抽取而言,每个约简能够表示成不同的单体知识,这些多约简共同形成多体知识系统,在实际应用中有着很重要的价值。
已经证明求解决策表的所有约简和最小约简是NP.hard问题。为此,通常采用启发式的方法进行属性约简。常用的启发式算法有基于信息熵的属性约简算法、基于可分辨矩阵的属性约简算法和基于正区域的属性约简算法。大多数启发式约简算法的基本思路是以核属性为起点,然后根据属性重要性的某种测度,依次选择核属性以外未被添加到约简集中最重要的属性,将其加入到约简集中,直到满足终止条件,由此得到决策表的一个约简。这一约简只能在知识系统中表示为单体知识。当前,多知识抽取是知识发现技术中面临的一个重要问题。
发明内容
为解决现有技术存在的上述问题,本发明要提出一种在现有信息体系中得到多体知识的知识抽取方法。
为了实现上述目的,本发明的技术方案如下:一种知识抽取的方法,包括以下步骤:
A、计算约简初值
根据公式(1)、(2)和(3)计算约简正区POS'E、约简论域U'、约简正区U′pos
记U/C={[u'1]C,[u'2]C,…,[u'm]C},则
U′={u′1,u'2,…,u'm}(2)
B、启用双矩编码策略
在解空间中搜索个体时,需要根据解空间的维度进行编码,所述的编码是将条件属性直接与搜索个体的位置维度形成映射,当信息系统论域对象超过4000、维度规模超过23时,每3个属性对应于一个编码单元,这样,在维度上表现为1位,位置的取值范围为0~7的整数;
C、搜索初始化
为不失一般性,假定约简的定义域为[0,r],即解空间最大取值为r,最小取值为0,解空间维度为d,如果步骤B中采用的是一位编码表示法,那么r=1;如果步骤B中采用的是缩位编码表示法,那么r=7;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学,未经大连海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210157204.7/2.html,转载请声明来源钻瓜专利网。