[发明专利]一种知识抽取的方法无效

申请号：	201210157204.7	申请日：	2012-05-18
公开（公告）号：	CN102663142A	公开（公告）日：	2012-09-12
发明（设计）人：	刘洪波;冯士刚;陈荣;张维石	申请（专利权）人：	大连海事大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	大连东方专利代理有限责任公司 21212	代理人：	李洪福
地址：	116026 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种知识抽取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种知识发现技术，特别是一种知识抽取方法。

背景技术

粗糙集理论是一种处理不精确、不一致与不完全数据的数学工具，它是波兰科学家Pawlak于1982年提出的，能在保持分类能力不变的前提下，通过知识约简获得知识的分类规则。与决策树、贝叶斯方法等相比，粗糙集方法不需要先验知识，仅利用数据本身所提供的信息系统中发现知识。在真实世界中，许多信息系统的知识体现通常并不唯一，有多个角度的知识，它们可能是信息系统中的不同属性的多个不同组合，其分类性能相当。这些多体知识在特定的环境中，将可能发挥不同的作用。例如，在多机器人实时路径选择中，内存记忆体容量足够的情况下，多体知识提供更多的路径选择，能够表现出更强的回避障碍能力。对于知识抽取而言，每个约简能够表示成不同的单体知识，这些多约简共同形成多体知识系统，在实际应用中有着很重要的价值。

已经证明求解决策表的所有约简和最小约简是NP．hard问题。为此，通常采用启发式的方法进行属性约简。常用的启发式算法有基于信息熵的属性约简算法、基于可分辨矩阵的属性约简算法和基于正区域的属性约简算法。大多数启发式约简算法的基本思路是以核属性为起点，然后根据属性重要性的某种测度，依次选择核属性以外未被添加到约简集中最重要的属性，将其加入到约简集中，直到满足终止条件，由此得到决策表的一个约简。这一约简只能在知识系统中表示为单体知识。当前，多知识抽取是知识发现技术中面临的一个重要问题。

发明内容

为解决现有技术存在的上述问题，本发明要提出一种在现有信息体系中得到多体知识的知识抽取方法。

为了实现上述目的，本发明的技术方案如下：一种知识抽取的方法，包括以下步骤：

A、计算约简初值

根据公式(1)、(2)和(3)计算约简正区POS'_E、约简论域U'、约简正区U′_pos

记U/C={[u'₁]_C,[u'₂]_C,…,[u'_m]_C}，则

U′＝{u′₁,u'₂,…,u'_m}(2)

U′POS={u′i1,u′i2,···u′it}---(3)]]>