[发明专利]一种改进的本体概念语义相似度计算方法在审
申请号: | 201610833690.8 | 申请日: | 2016-09-20 |
公开(公告)号: | CN106610945A | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 金平艳 | 申请(专利权)人: | 四川用联信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 本体 概念 语义 相似 计算方法 | ||
技术领域
本发明涉及语义网络技术领域,具体涉及一种改进的本体概念语义相似度计算方法。
背景技术
现如今,语义相似度计算被广泛应用于信息检索、语义web、自然语言处理等领域。由于本体能够将领域中的各种概念和关系进行显示地、形式化地表达,因此本体在概念语义相似度计算中发挥重要的作用。传统的基于本体的概念语义相似度计算方法主要分为两种:一种是基于信息论的方法,该方法利用信息论来计算两个概念共享信息的程度,具有较高的理论严谨性,但是只能粗略地量化概念之间的语义相似度,不能实现概念语义相似度的细致区分;另一种方法是基于语义距离的方法,该方法以概念之间路径的长短作为衡量语义距离的长短,通过计算两概念之间的语义距离来实现概念语义相似度的计算,该方法简单、直观,但忽略了影响语义距离的其他很多因素。针对信息论方法的缺陷,引入了语义距离来克服了信息论方法语义区分不细致问题,在基于语义距离方法中,概念语义相似度不仅与语义距离有关,而且还受概念在本体树中的层次深度、密度影响,为了提高求解语义相似度的准确度,满足上述需求,本发明提出了一种改进的本体概念语义相似度计算方法。
发明内容
针对信息论方法的缺陷,引入了语义距离来克服了信息论方法语义区分不细致的问题,在基于语义距离方法中,概念语义相似度不仅与语义距离有关,而且还受概念在本体树中的层次深度、密度影响,为了提高求解语义相似度的准确度,本发明提供了一种改进的本体概念语义相似度计算方法。
为了解决上述问题,本发明是通过以下技术方案实现的:
步骤1:初始化本体概念领域模块。
步骤2:根据改进的基于信息论方法求解两本体概念(g1,g2)间的语义相似度sim1(g1,g2)。
步骤3:根据改进的基于语义距离方法求解两本体概念(g1,g2)间的语义相似度sim2(g1,g2)。
步骤4:根据两本体概念节点(g1,g2)对应深度D(g1)、D(g2)与密度,构造两本体概念语义相似度sim3(g1,g2)。
步骤5:综合上述步骤,得到最终两本体概念间的语义相似度sim(g1,g2)。
本发明的有益效果是:
1、相比较传统的基于信息论方法、基于语义距离方法求解语义相似度,此方法准确度更高。
2、该方法既克服了信息论方法语义区分不细致问题,又使得语义距离计算具有一定的理论严谨性。
3、此计算语义相似度的方法在量化概念上更接近专家的经验值。
4、更好的提高了本体推理的效果。
5、具有更广泛的应用研究价值。
附图说明
图1为一种改进的本体概念语义相似度计算方法结构流程图。
图2为本体概念领域模块语义树形图。
具体实施方式
为了解决信息论方法的缺陷,引入了语义距离来克服了信息论方法语义区分不细致问题,在基于语义距离方法中,概念语义相似度不仅与语义距离有关,而且还受概念在本体树中的层次深度、密度影响,为了提高求解语义相似度的准确度,结合图1对本发明进行了详细说明,其具体实施步骤如下:
步骤1:初始化本体概念领域模块。
步骤2:根据改进的基于信息论方法求解两本体概念(g1,g2)的语义相似度sim1(g1,g2),其具体求解过程如下:
步骤2.1)分别求解其共同父节点在在树状层次结构中的信息量值I(pr)
基于信息内容的计算相似度方法主要是通过衡量概念所包含的信息量来计算相似度。概念是对其祖先节点的继承,是祖先节点的又一次细化,所以可通过祖先节点包含的信息量来衡量两个概念的共享信息。
根据图2,得出两本体概念(g1,g2)共同父节点在树状层次结构中每层出现的概率值p(pr)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川用联信息技术有限公司,未经四川用联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610833690.8/2.html,转载请声明来源钻瓜专利网。