[发明专利]一种知识抽取的方法无效

专利信息
申请号: 201210157204.7 申请日: 2012-05-18
公开(公告)号: CN102663142A 公开(公告)日: 2012-09-12
发明(设计)人: 刘洪波;冯士刚;陈荣;张维石 申请(专利权)人: 大连海事大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 大连东方专利代理有限责任公司 21212 代理人: 李洪福
地址: 116026 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 知识 抽取 方法
【说明书】:

技术领域

发明涉及一种知识发现技术,特别是一种知识抽取方法。

背景技术

粗糙集理论是一种处理不精确、不一致与不完全数据的数学工具,它是波兰科学家Pawlak于1982年提出的,能在保持分类能力不变的前提下,通过知识约简获得知识的分类规则。与决策树、贝叶斯方法等相比,粗糙集方法不需要先验知识,仅利用数据本身所提供的信息系统中发现知识。在真实世界中,许多信息系统的知识体现通常并不唯一,有多个角度的知识,它们可能是信息系统中的不同属性的多个不同组合,其分类性能相当。这些多体知识在特定的环境中,将可能发挥不同的作用。例如,在多机器人实时路径选择中,内存记忆体容量足够的情况下,多体知识提供更多的路径选择,能够表现出更强的回避障碍能力。对于知识抽取而言,每个约简能够表示成不同的单体知识,这些多约简共同形成多体知识系统,在实际应用中有着很重要的价值。

已经证明求解决策表的所有约简和最小约简是NP.hard问题。为此,通常采用启发式的方法进行属性约简。常用的启发式算法有基于信息熵的属性约简算法、基于可分辨矩阵的属性约简算法和基于正区域的属性约简算法。大多数启发式约简算法的基本思路是以核属性为起点,然后根据属性重要性的某种测度,依次选择核属性以外未被添加到约简集中最重要的属性,将其加入到约简集中,直到满足终止条件,由此得到决策表的一个约简。这一约简只能在知识系统中表示为单体知识。当前,多知识抽取是知识发现技术中面临的一个重要问题。

发明内容

为解决现有技术存在的上述问题,本发明要提出一种在现有信息体系中得到多体知识的知识抽取方法。

为了实现上述目的,本发明的技术方案如下:一种知识抽取的方法,包括以下步骤:

A、计算约简初值

根据公式(1)、(2)和(3)计算约简正区POS'E、约简论域U'、约简正区U′pos

记U/C={[u'1]C,[u'2]C,…,[u'm]C},则

U′={u′1,u'2,…,u'm}(2)

UPOS={ui1,ui2,···uit}---(3)]]>

B、启用双矩编码策略

在解空间中搜索个体时,需要根据解空间的维度进行编码,所述的编码是将条件属性直接与搜索个体的位置维度形成映射,当信息系统论域对象超过4000、维度规模超过23时,每3个属性对应于一个编码单元,这样,在维度上表现为1位,位置的取值范围为0~7的整数;

C、搜索初始化

为不失一般性,假定约简的定义域为[0,r],即解空间最大取值为r,最小取值为0,解空间维度为d,如果步骤B中采用的是一位编码表示法,那么r=1;如果步骤B中采用的是缩位编码表示法,那么r=7;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连海事大学,未经大连海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210157204.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top