[发明专利]一种基于本体的密度自适应概念语义相似度计算方法有效
申请号: | 201810025611.X | 申请日: | 2018-01-11 |
公开(公告)号: | CN108256030B | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 李飞;廖乐健;何景 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F40/30;G06F40/247 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 王民盛 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 本体 密度 自适应 概念 语义 相似 计算方法 | ||
1.一种基于本体的密度自适应概念语义相似度计算方法,简称相似度计算方法,其特征在于:包括以下步骤:
步骤1:输入两个概念以及给定的本体,通过在本体中分别查询这两个概念,得到每个概念对应的义项;
步骤2:判断任意一个概念查询的义项是否为空,并进行相应操作:
2.1:若是,说明本体中不包含输入的概念,不能计算这两个概念的语义相似度,则计算步骤结束,即结束本相似度计算方法;
2.2:若否,执行步骤3;
步骤3:将步骤1中两个概念对应的义项按顺序排列构成义项笛卡尔集;
步骤4:判断所有结点是否在一个根结点中,并进行相应操作;
其中,一个结点,即为某一个概念对应的其中的一个义项;
4.1:若是,执行步骤5;
4.2:若否,为所有结点虚构一个根结点,使本体只具有一个根结点;
步骤5:从义项笛卡尔集中取出一个元素,并将取出的元素从义项笛卡尔集中删除,查询本体,分别得到取出的元素中每个义项通过“上下位”关系连接形成的到根结点的路径,将每个义项到根结点的路径作为一个集合构成两个路径集合;
步骤6:将步骤5中两个路径集合按顺序排列构成路径笛卡尔集;
步骤7:从路径笛卡尔集中取出一个元素,并将取出的元素从路径笛卡尔集中删除,找出取出的元素中两条路径最末端的两个结点的最近公共上位结点;
步骤8:从步骤7取出的元素中得到最近公共上位结点到根结点的路径以及两个义项结点到最近公共上位结点的路径;
步骤9:计算两个义项结点的最近公共上位结点的深度权重以及两个义项结点间的最短路径权重,包括如下子步骤:
9.1计算两个义项结点的最近公共上位结点的深度权重,计算方式如公式(1)所示:
其中,s1和s2表示任意两个义项结点,LCS(s1,s2)表示义项结点s1和s2的最近公共上位,depthweight(LCS(s1,s2))表示LCS(s1,s2)的深度权重,root表示根结点,edge(LCS(s1,s2),root)表示最近公共上位结点通过“上下位”关系连接到根结点的路径上边的集合,es→p表示任意相邻结点s与p通过“上下位”关系连接的边,且结点p是结点s的直接上位结点,directhypon(p)表示结点p的直接下位结点组成的集合,直接下位结点包含结点p本身,|directhypon(p)|表示结点p的直接下位结点的个数;
9.2计算两个义项结点间的最短路径权重,计算公式如式(2)所示:
其中,s1和s2表示任意两个义项结点,pathLenweight(s1,s2)表示义项结点s1和s2之间的最短路径权重,edge(s1,s2)表示义项结点s1和s2通过“上下位”关系连接的最短路径上边的集合,es→p表示任意相邻结点s与p通过“上下位”关系连接的边,且结点p是结点s的直接上位结点,directhypon(p)表示结点p的直接下位结点组成的集合,直接下位结点包含结点p本身,|directhypon(p)|表示结点p的直接下位结点的个数;
步骤10:用步骤9中的最短路径权重和深度权重替换目前基于边的方法中的最短路径和深度计算方式,计算出两个义项之间的语义相似度,并保存得到的语义相似度;
步骤11:判断在步骤6中构成的路径笛卡尔集目前是否为空,并执行相应操作:
11.1若是,说明从义项笛卡尔集中取出的义项对之间的语义相似度计算完成,执行步骤12;
11.2若否,则跳至步骤7;
步骤12:从步骤10保存的义项语义相似度中得到两个义项语义相似度结果的最大值,即为两个义项的语义相似度,并将结果保存;
步骤13:判断在步骤3中构成的义项笛卡尔集目前是否为空,并执行相应操作:
13.1若是,说明两个概念的语义相似度计算完成,执行步骤14;
13.2若否,则跳至步骤5;
步骤14:从步骤12保存的义项对的语义相似度中得到所有义项对语义相似度的最大值,即为两个概念的语义相似度;
至此,经过步骤1到步骤14,完成了一种基于本体的密度自适应概念语义相似度计算方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810025611.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种台灯控制系统的控制方法
- 下一篇:印刷电路板结构及其形成方法