[发明专利]基于领域本体的语义搜索系统及搜索方法有效
申请号: | 201910904762.7 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110659350B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 叶育鑫;周黎;罗昌凯;常志威;欧阳丹彤 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 长春众邦菁华知识产权代理有限公司 22214 | 代理人: | 朱红玲 |
地址: | 130000 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 领域 本体 语义 搜索 系统 方法 | ||
1.基于领域本体的语义搜索系统,包括领域本体库,语义标注后的资源库,推理规则库,推理节点以及相似度计算节点;
所述领域本体库,用于存储对应领域的知识或概念,所述领域本体用OWL文件实现;
所述语义标注后的资源库,用于存储所要查询的资源,对所述查询的资源进行语义标注,描述了查询的资源与领域本体中概念的关系,语义标注用RDF实现;
所述推理规则库,用于存储推理节点所使用的自定义的推理规则;
所述推理节点,用于推理实现语义搜索服务,并将推理结果通过相似度计算节点计算;
所述相似度计算节点,用于计算两个概念间的语义相似度;
具体搜索方法为:
步骤一、建立持续可更新的领域本体库;
具体过程为:包括明确目标和范围、知识获取、形式化和编码;
所述明确目标和范围是指确定好所要建立的本体对象及其概念边界;知识获取是指获取领域里的每一个概念的定义、性质、重要术语和概念之间的关系及其层次结构;形式化是指将每一个概念或知识以三元组的形式组织起来,建立统一的表达形式;
步骤二、对查询资源进行语义标注;
包括确定属性和关系、形式化及语义标注;确定属性和关系是要确定资源所具有的相关属性及与其相关概念或其他实例的关系;形式化是指将上述得到的关于资源的属性和关系等信息形式化表达,最后得到基于资源语义描述框架的语义描述信息;
步骤三、根据本体结构和资源之间的关系自定义推理规则;
步骤四、接收用户的查询请求;
步骤五、推理引擎对用户提出的查询请求进行分析,对查询资源进行推理分析,获得推理结果;
步骤六、计算推理结果和查询内容之间的语义相似度,根据相似度对推理结果由大到小排序;
步骤六中,所述语义相似度的计算过程包括:依次计算概念深度、计算概念密度、计算共享路径的重合度、计算语义距离以及进行综合语义相似度计算;
计算概念深度的具体过程为:
概念节点的深度是指概念在所处的本体中的层次深度,定义根节点的深度为1,概念节点M的深度为Depth(M),Depth(M)=Depth(parent(M))+1,其中parent(M)为节点M的父节点;对于本体中的两个概念节点x、y,通过下式获得在的深度方面的语义相似度,公式如下:
式中Depth(x)、Depth(y)、Depth(LCA)分别为概念x、y最近共同祖先节点LCA的深度信息;概念节点处于本体的层次越深,表示内容就越具体,则概念间的相似度越大,反之概念间的相似度越小;LCA节点的深度越深,表示概念的分类越具体,则概念之间的相似度越大,反之,概念之间的相似度越小;
步骤七、对排序后的推理结果结合实例资源的其他相关信息其他内容组成完整页面返回给用户。
2.根据权利要求1所述的搜索系统,其特征在于:计算概念密度,具体为:
以概念节点C为根节点的子树节点数,记为count(TreeC),本体中总节点数记为count(Tree),对于两个概念节点x、y,获得在密度方面的语义相似度,公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910904762.7/1.html,转载请声明来源钻瓜专利网。