[发明专利]一种改进的本体概念语义相似度计算方法在审
申请号: | 201610833690.8 | 申请日: | 2016-09-20 |
公开(公告)号: | CN106610945A | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 金平艳 | 申请(专利权)人: | 四川用联信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 本体 概念 语义 相似 计算方法 | ||
1.一种改进的本体概念语义相似度计算方法,本发明涉及语义网络技术领域,具体涉及一种改进的本体概念语义相似度计算方法,其特征是,包括如下步骤:
步骤1:初始化本体概念领域模块
步骤2:根据改进的基于信息论方法求解两本体概念间的语义相似度
步骤3:根据改进的基于语义距离方法求解两本体概念间的语义相似度
步骤4:根据两本体概念节点对应深度与密度,构造两本体概念语义相似度
步骤5:综合上述步骤,得到最终两本体概念间的语义相似度。
2.根据权利要求1中所述的一种改进的本体概念语义相似度计算方法,其特征是,以上所述步骤3中的具体计算过程如下:
步骤3:根据改进的基于语义距离方法求解本体概念的语义相似度,其具体计算过程如下:
在一个本体树中,可以根据概念节点间的路径距离长短判断其语义相似程度,如果两个节点之间的距离越近,这2个节点所代表的概念间的相似度越大;反之,2个概念节点的距离越远,相似度越小
2个概念节点间的边数往往不是唯一的,节点之间存在多个路径连通
把概念与共同父节点作为树的子集,假设存在n个这样的子集,即
从n个子集中找出概念经共同父节点的共现有向边个数为
n个子集中概念经共同父节点有向边的总个数为
最后得。
3.根据权利要求1中所述的一种改进的本体概念语义相似度计算方法,其特征是,以上所述步骤4中的具体计算过程如下:
步骤4:根据两本体概念节点对应深度与密度,构造两本体概念语义相似度需先构造深度对两本体概念语义相似度的影响函数以及密度对两本体概念语义相似度的影响函数其具体求解过程如下:
步骤4.1)先构造深度对两本体概念语义相似度的影响函数
概念节点的深度是指概念在所处的本体树中的层次深度,在本体树中,每个概念节点都是对上一层节点的一次细化,因此概念节点处于本体树中层次越深,则表示的内容越具体,概念间的相似度越大,反之概念间的相似度越小
这里深度值从根节点开始,根节点的深度值为1,从概念与共同父节点构成的树子集中分别找到两最短路径的共同父节点,即
则有:
分别为概念的共同父节点在本体树中的最短深度
从而构造下列影响因子:
两本体概念在本体树中的深度为:
即两本体概念在本体树中得平均深度为:
从而构造下列影响因子:
上式为本体树的深度
综上,有下式:
步骤4.2)构造密度对两本体概念语义相似度的影响函数
概率节点密度越大,则其直接子节点数目越多,节点细化的越具体,各直接子节点之间的相似度越大
从概念与共同父节点构成的树子集中找到共同父节点产生的直接子节点数最少的,记为
从概念与共同父节点构成的树子集中找到共同父节点产生的直接子节点数最多的,记为
则有:
步骤4.3)由上述步骤可得:
上式分别为深度、密度对本体概念语义相似度的影响权重因子,且则深度对对本体概念语义相似度的影响更大,若则密度对对本体概念语义相似度的影响更大,可以根据实验测试出来。
4.根据权利要求1中所述的一种改进的本体概念语义相似度计算方法,其特征是,以上所述步骤5中的具体计算过程如下:
步骤5:综合上述步骤,得到最终两本体概念间的语义相似度
上式A、B、C分别为基于信息论方法得到的基于语义距离方法得到的以及根据本体概念深度与密度得到的对本体概念语义相似度的影响权重因子,同理A+B+C=1,按照A、B、C从大到小顺序,依次分配其对对本体概念语义相似度的影响,越大,则影响越大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川用联信息技术有限公司,未经四川用联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610833690.8/1.html,转载请声明来源钻瓜专利网。