[发明专利]本体融合的方法、装置、电子设备及存储介质有效
申请号: | 202310656132.9 | 申请日: | 2023-06-05 |
公开(公告)号: | CN116383345B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 马鹤桐;李姣;王序文;沈柳 | 申请(专利权)人: | 中国医学科学院医学信息研究所 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张欣然 |
地址: | 100020*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 本体 融合 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种本体融合的方法、装置、电子设备及存储介质。其中,在本体融合的方法中,首先获取主本体和待融合本体的本体信息,其中,所述本体信息包括本体中各个节点的语义类型、概念、关系、其他属性。然后通过语义类型匹配、语义类型融合、概念匹配、概念融合、关系融合、其他属性融合等手段将不同本体进行全方位的数据融合,将重复数据进行融合,最大限度进行了匹配及融合操作,得到一个更综合的本体。解决了现有技术中互有覆盖的不同本体在融合的时候无法最大限度保留已有信息,遗落大量有价值的概念,属性等信息的问题。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种本体融合的方法、装置、电子设备及存储介质。
背景技术
本体是某一领域的概念的集合,是集成了多个高质量知识库的知识表达系统,可以展示概念、词汇、并延展关系与规则,很大程度上明确了某一领域的范围,提升信息检索效率。在许多专业领域,本体能够提升研究人员的信息检索查全率与查准率,从而提升检索效率,定位到准确的目标信息与文献。
但一个综合的专业领域往往包含多个细分领域的本体,本体与本体之间通常都存在相互重叠,共同覆盖的部分。而现有技术中没有有效的手段去处理本体数据重叠的问题,当用户通过相互重叠的本体进行检索时,不仅会生成大量重复内容,同时也会导致用户浪费更多时间进行重复检索。因此本体融合在任何专业领域中都是必要的,但当下的本体融合结束后,无法最大限度地融合已有本体,会遗漏大量重要信息,如概念及属性。
发明内容
有鉴于此,本申请提供了一种本体融合的方法、装置、电子设备及存储介质,以解决现有技术中互有覆盖的不同本体之间融合过程中无法最大限度融合已有本体,遗漏大量重要信息的问题。
为实现上述目的,本申请提供如下技术方案:
本申请第一方面公开了一种本体融合的方法,包括:
获取主本体和待融合本体的本体信息,其中,所述本体信息包括本体中各个节点的语义类型、概念、关系、其他属性;
针对所述待融合本体的每一个节点,基于所述语义类型与所述主本体的中的各个节点进行语义类型匹配;
针对所述待融合本体中语义类型匹配成功的每一个节点,基于所述概念,与所述主本体中的各个节点进行概念匹配;若概念匹配成功,则进行节点概念融合;若概念匹配不成功,则进行节点语义类型融合;
针对所述待融合本体中未进行概念融合的每一个节点,基于所述概念,与所述主本体每一个节点进行概念匹配,若概念匹配成功,则进行节点概念融合;
针对已进行概念融合的节点,确定所述节点是否存在待融合的关系,若确定出所述节点存在待融合的关系,则对所述节点进行关系融合;
针对已进行概念融合的节点,确定所述节点是否存在待融合的其他属性,若确定出所述节点存在待融合的其他属性,则对所述节点进行其他属性融合。
可选的,上述的方法,所述针对所述待融合本体的每一个节点,基于所述语义类型与所述主本体的中的各个节点进行语义类型匹配,包括:
分别获取待进行语义类型匹配的两个节点的语义类型字符串;
将所述待进行语义类型匹配的两个节点的语义类型字符串进行对比;
若所述待进行语义类型匹配的两个节点的语义类型字符串一致,则语义类型匹配成功;若所述两个节点的语义类型字符串不一致,则语义类型匹配不成功。
可选的,上述的方法,所述针对所述待融合本体中语义类型匹配成功的每一个节点,基于所述概念,与所述主本体中的各个节点进行概念匹配,包括:
对待进行概念匹配的两个节点进行字符串匹配,得到字符串匹配结果;
对所述待进行概念匹配的两个节点进行相似度计算,得到概念相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国医学科学院医学信息研究所,未经中国医学科学院医学信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310656132.9/2.html,转载请声明来源钻瓜专利网。