[发明专利]基于领域本体的语义搜索系统及搜索方法有效
申请号: | 201910904762.7 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110659350B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 叶育鑫;周黎;罗昌凯;常志威;欧阳丹彤 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 长春众邦菁华知识产权代理有限公司 22214 | 代理人: | 朱红玲 |
地址: | 130000 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 领域 本体 语义 搜索 系统 方法 | ||
基于领域本体的语义搜索系统及搜索方法,涉及信息检索技术领域,解决现有搜索技术并没有考虑具体实例资源与查询概念之间的关系以及实例资源之间的关系等问题,包括领域本体库,语义标注后的资源库,推理规则库,推理节点以及相似度计算节点;领域本体库用于存储对应领域的知识或概念,所述领域本体用OWL文件实现;语义标注后的资源库用于存储所要查询的资源,对查询的资源进行语义标注,描述查询的资源与领域本体中概念的关系,语义标注用RDF实现;推理规则库用于存储推理节点所使用的自定义的推理规则;推理节点用于推理实现语义搜索服务,并将推理结果通过相似度计算节点计算;相似度计算节点用于计算两个概念间的语义相似度。
技术领域
本发明涉及信息检索技术领域,涉及一种基于领域本体的语义搜索系统及方法。
背景技术
面对互联网信息的爆炸式增长,信息搜索是人们获得期望信息的最有效手段之一,搜索引擎是人们生活中不可或缺的工具,然而传统的搜索引擎通过关键字检索用户所需要的信息,这种搜索模式无法自发地将关键字与实体相关联,而只能匹配文档中的信息和关键词的次数,使得搜索效果不尽人意,在查全率以及查准率上有许多问题。
在领域知识的搜索中,应用本体技术,实现一定的语义搜索。这种搜索模式不再拘泥于关键词本身,而是理解关键词所代表的语义,进而进行搜索。其核心在于本体层知识的表达与表示,同时又涉及相关的规则与推理技术,在查询过程中,将查找内容映射到本体里相关主题概念上,进而应用推理技术,使得推理结果更接近用户的需求。本体的使用提供了以下的几个优点:1.通过查找与特定概念相关的信息而不是用模糊关键字匹配以提高查询的语义理解和查询结果的查全率和查准率;2.允许在不同领域上重用其领域知识本体。
发明内容
本发明为解决现有搜索技术并没有考虑具体实例资源与查询概念之间的关系以及实例资源之间的关系等问题,提供一种基于领域本体的语义搜索系统及搜索方法,提高搜索的查准率和查全率。
基于领域本体的语义搜索系统,包括领域本体库,语义标注后的资源库,推理规则库,推理节点以及相似度计算节点;
所述领域本体库,用于存储对应领域的知识或概念,所述领域本体用OWL文件实现;
所述语义标注后的资源库,用于存储所要查询的资源,对所述查询的资源进行语义标注,描述了查询的资源与领域本体中概念的关系,语义标注用RDF实现;
所述推理规则库,用于存储推理节点所使用的自定义的推理规则;
所述推理节点,用于推理实现语义搜索服务,并将推理结果通过相似度计算节点计算;
所述相似度计算节点,用于计算两个概念间的语义相似度。
基于领域本体的语义搜索方法,该方法由以下步骤实现:
步骤一、建立持续可更新的领域本体库;
具体过程为:包括明确目标和范围、知识获取、形式化和编码;
所述明确目标和范围是指确定好所要建立的本体对象及其概念边界;知识获取是指获取领域里的每一个概念的定义、性质、重要术语和概念之间的关系及其层次结构;形式化是指将每一个概念或知识以三元组的形式组织起来,建立统一的表达形式;
步骤二、对查询资源进行语义标注;
包括确定属性和关系、形式化及语义标注;确定属性和关系是要确定资源所具有的相关属性及与其相关概念或其他实例的关系;形式化是指将上述得到的关于资源的属性和关系等信息形式化表达,最后得到基于资源语义描述框架的语义描述信息;
步骤三、根据本体结构和资源之间的关系自定义推理规则;
步骤四、接收用户的查询请求,获取查询概念,并判断是否是本体概念若不是则重新获取;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910904762.7/2.html,转载请声明来源钻瓜专利网。