[发明专利]一种综合的本体相似度检测方法无效
申请号: | 201010258821.7 | 申请日: | 2010-08-20 |
公开(公告)号: | CN101930462A | 公开(公告)日: | 2010-12-29 |
发明(设计)人: | 王芙蓉;田颖 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市德权律师事务所 11302 | 代理人: | 周发军 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 综合 本体 相似 检测 方法 | ||
技术领域
本发明属于本体建模领域,涉及一种综合的本体相似度检测方法,尤其涉及一种基于明确概念权重的综合各方面指标的本体相似度检测方法。
背景技术
本体是对共享概念模型的形式化规范说明。本体定义了领域的概念及其关系,方便了知识共享和重用,近年来已经成为语义web、人工智能、数据集成、信息检索等研究领域的热门课题,并在这些领域中扮演着重要的角色。但在迅速发展的过程中,本体构建缺乏统一的标准,导致同一领域内的本体研究者对于领域知识表述不同,构建的本体之间存在一定的异构性,从而影响了知识的有效共享和重用。为解决异构性问题,研究者提出本体映射的方法,其目的是找出不同本体中实体之间的语义关联,并且将其形式化地表达出来。本体映射是应用系统之间语义信息互操作实现的基础,而概念相似度计算则是本体映射的关键部分。
相似度即两个对象相似的程度,形式化定义本体相似度如下:
Ci标号为i的本体,i∈N;
Sim(x,y):相似度函数;
ei,j:本体Ci的概念,ei,j∈(Ci,RCi,j,Ii),概念标号j∈N;
Sim(ei1,j1 ei2,j2):概念ei1,j1和概念ei2,j2间的概念相似度函数,i≠j。
本体相似度计算是以概念相似度为基础的,即两个本体之间的相似度,是由本体内部概念之间配对相似度来决定的,其计算过程涉及到本体的所有概念及其之间的关系。两个不同本体的概念组成的概念对之间的相似度,除了与概念自身的属性有关之外,还与概念在自身的本体中所处的上下文环境有很大的关系。相似度取值范围在0-1之间。如果两个概念完全相似,则相似度为1;如果两概念没有任何共有特征,是两个完全不同的概念,则相似度为0。相似度的对称性要求,概念A、B的相似性必须与B、A的相似性相同。
相似度计算可以从实体、语义网络、描述逻辑、约束、规则五个方面衡量。它们可以看作是一个相似度栈,如图3中显示,它们的语义复杂度从下到上逐渐增强,依据各个层次的语义特征,有不同的相似度计算方法。而特殊共享的领域本体,从上到下覆盖了所有层次,可以位于相似度栈的任一层次。
下面提出目前已有的概念相似度计算,并对其特点进行分析。
从实体层的角度来看,相似度计算方法可分为:
(1)基于语法的方法:
Levenshtein distance算法通过字符串匹配以及字符串之间的编辑距离来计算相似值,并扩展到语句,没有考虑概念的语义映射关系。编辑距离为字符串转换所需的最小数目的单元编辑操作,包括字符的插入、删除、替换及相邻字符的调换。
(2)基于词义或者自然语言的方法:
借鉴Wordnet等特定应用字典,比较两个实体是否为同义词以及词义相近程度。知识库评估语义相似度
语义网络层包含许多概念和复杂的关系,蕴含着大量背景信息。概念是对象的通用类,它们通过特征和属性与其它概念关联起来。从语义网络层的角度来看,相似度计算应考虑本体的结构。概念间的层次结构可以图或树的形式表示出来,节点关系,如父结点、子结点、兄弟结点等,反映了本体中的父类、子类关系。
从语义网络层的角度出发,提出的相似度计算方法有:
(1)采用信息理论方法评估。通过计算包含相同子孙结点的概率值比较两个对象之间的相似度;
(2)采用本体距离评估。利用两个结点通过共有祖先的最短路径或者连接两个结点的共有后代的通用最短路径来计算相似性。此方法高度依赖于本体的构建,适用于同一本体内的语义相似计算。
(3)采用结点的语义距离评估。计算结点本身的基距离,然后参考语义关系,分别计算父结点、子结点、孙子结点的基距离。将几个基距离加权平均,得到一对结点的语义距离。
描述逻辑体现了本体的复杂性。它包含原子概念的类型以及与其它原子概念的关系,主要考虑构成本体的描述逻辑的语法。不同本体特殊化和形式化水平不同,计算方法页不同。M.Adrea Rodriguez Max和J.Egenhofer提出利用概念定义计算概念间相似度的方法。利用同义词集、语义相邻函数和不同概念特征相应进行匹配,比较不同本体的概念,得到3个相似度值,然后求加权平均得到两个概念的语义相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010258821.7/2.html,转载请声明来源钻瓜专利网。