[发明专利]一种智能语义网中本体概念模糊相似度度量方法有效

专利信息
申请号: 201110245928.2 申请日: 2011-08-25
公开(公告)号: CN102426578A 公开(公告)日: 2012-04-25
发明(设计)人: 刘发贵;肖芬;张杨 申请(专利权)人: 华南理工大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 何淑珍
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 智能 语义 本体 概念 模糊 相似 度量 方法
【说明书】:

技术领域

发明属于智能语义网中本体概念相似度度量领域,具体涉及一种智能语义网中本体概念模糊相似度度量方法。

背景技术

自蒂姆·伯纳斯一李(Tim Berners-Lee)于2000年提出了“语义网(Semantic Web)”的概念后,有关语义网方面的研究与尝试便越来越多。语义网的目标,就是让“机器能够读懂万维网上的内容”。我们之所以能够读懂网页的内容,是因为我们首先共享了对各种词汇约定的意思,然后通过综合推理,得出句子、段落的意义。因此,机器要够理解人的意思,首先必须拥有一份与人类共享的、对词汇的理解的知识。目前人们使用的这份共享的知识,就是本体(ontology)。本体大致可以看成是一系列特定的词汇以及相关的假设或公式,这些假设或公式则是对词汇的解释。简单来讲,计算机科学中的本体,可以看成是概念(词汇)以及概念与概念之间的关系。

呈现于本体库中的概念,是人们用于提高搜索能力的重要工具,例如利用本体描述语言描述服务,提高服务的匹配效果;通过概念在本体库中的相互关系,提高论文检索的查全率和查准率;利用本体概念的综合推理,提高搜索能力。这些都涉及到概念的匹配问题。现有技术中有利用本体概念中的上下位关系(直接父子、直接子父、间接父子关系)把匹配分为Exact, Plug-in, subsume和fail四个等级,这种方法简单,实验结果也证明其较高的查准率,但是当同一等级内的概念较多的时候,无法进行更细致的区别。基于相似度的概念匹配算法通过计算两个本体概念间的相似度(一个介于0到1之间的数值)来获得更精确的匹配结果,相当于将匹配等级扩充到无限等级,从而可以迅速地判断最优匹配概念,很好地解决了区分度的问题。

概念之间的相似度度量通常必须满足以下的一些特性:一、概念的深度:两个概念的共同祖先的深度越深,说明他们共享的特征属性越多,他们的相似度越高;二、同一层概念的边的密度:密度越大,说明这一层分得越细,他们共享的特征也越多,相似度越高;三、相似度是不对称的:当两个概念之间存在父子关系时,考虑到当我们提到父概念时指的是子概念的概率往往大于当我们提到子概念时指的是父概念时的概率,因此,父概念对子概念的相似度要高于子概念对父概念的相似度。

目前基于本体概念相似度的计算主要有两种模型,一种是网络节点距离模型,主要的思想是把本体中的概念看成有向图的结点,概念之间的关系是则是有向图的边,直觉上结点之间的距离越小,他们的相似度就越高。为实现上面提到的三种特性,人们尝试了很多方法来为结点(也就是概念)与结点之间的边赋值(即关系的权重),但是目前还没有哪个公式可以很好地同时满足上述提及的三个特性。另一种模型是信息理论模型,其基本思想是利用两个概念之间的共享信息来反映它们之间的相似度。共享的信息越多,它们的相似度越大,具体实现时一般使用两个概念的最近共同祖先的信息容量来反映两个概念之间的共享信息。这种方法事实上只能解决上述提及的三个特性中的第一个特性—概念的深度,对于第二特性和第三特性则无法满足。另外,基于本体的相似度计算方法为了简化模型,往往把概念的层次结构定义得很分明,形成一棵严格的树形结构,这样模型的概念间相似度将很大程度上依赖于本体的构建,因此并不能很好地满足复杂的现实情况。

发明内容

针对现有技术的缺点,本发明的目的是提供一种能够同时满足概念间相似度的三个特性,并支持复杂本体中子概念出现多个父概念时相似度计算的智能语义网中本体概念模糊相似度度量方法。

为实现上述目的,本发明的技术方案为:

一种智能语义网中本体概念模糊相似度度量方法,包括以下步骤:

A.将本体概念扩展成为解释集                                               ,所述解释集包括isA子集、relatedTo子集和nearTo子集;

其具体是,将与所述本体概念相关的本体概念分为三类,第一类本体概念是本体概念本身及所述本体概念以上的祖父概念集,将第一类本体概念存储在isA子集内,第二类本体概念是与所述本体概念有属性关系的本体概念及有属性关系的本体概念以上的祖父概念集,将第二类本体概念存储在relatedTo子集内,第三类本体概念是与该本体概念有同一父节点的兄弟概念集,将第三类本体概念存储在nearTo子集内;所述解释集表示如下:

其中、、表示三个子集对解释集的权重,不失合理性,有,且;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110245928.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top