[发明专利]用于知识图中进行关键词搜索的计算机实现的方法在审
申请号: | 202110684997.7 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113901149A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | E·卡尔拉莫夫 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 任一方;刘春元 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 知识 进行 关键词 搜索 计算机 实现 方法 | ||
用于知识图中进行关键词搜索的计算机实现的方法。用于在数据集(Q)中进行关键词搜索的计算机实现的方法(100),其中数据集(Q)的数据(q)由知识图(KG)表示,其中知识图(KG)包括表示数据集(Q)的实体(v)的顶点(v)和表示所述实体(v)之间的关系的边(e),所述方法(100)包括以下步骤:提供(110)连接关键词查询的至少两个实体(v)的知识图(KG)的子图()的集合;基于每个子图()与数据集(Q)的相关性()(称为数据相关性)和每个子图()的实体(v)彼此的相关性()(称为内部相关性)两者来计算(120)每个子图()的相关性(,和根据子图()的集合中的子图()的相关性(对子图()进行排序(130)。
背景技术
本公开涉及一种用于在数据集中进行关键词搜索的计算机实现的方法,其中数据集的数据由知识图表示。
此外,本公开涉及一种用于在数据集中进行关键词搜索的系统和一种用于在数据集中进行关键词搜索的计算机程序。
知识图KG是一个图,其中顶点是用二元关系互连的实体,并用类型和数据值进行注释。越来越多的知识图已经被开发用于各种领域。知识图支持从企业数据集成到智能搜索的广泛任务。
基于知识图的应用的重要任务是提取与给定顶点集合相关的子图,也称为关系子图RSG。例如,可以在关键词搜索期间选择知识图中的顶点集合,其中用户通过提出关键词集合来查询知识图,并且系统将它们与知识图的实体相匹配,找到知识图中关联这些实体的关系子图,并且将它们作为答案返回。
为了有效地丰富,子图应该与上下文、即数据集的内容相关。因此,本公开的任务是提供子图相关性的度量。
发明内容
这通过根据独立权利要求的系统和方法来实现。
实施例涉及一种用于在数据集中进行关键词搜索的计算机实现的方法,其中数据集的数据由知识图表示,其中知识图包括表示数据集的实体的顶点以及表示所述实体之间的关系的边,该方法包括以下步骤:
提供连接关键词查询的至少两个实体的知识图的子图集合;
基于每个子图与数据集的相关性(称为数据相关性)和每个子图的实体彼此的相关性(称为内部相关性)两者来计算每个子图的相关性,以及
根据子图集合中子图的相关性对子图进行排序。
有利地,从两个角度考虑子图的相关性:子图与数据集的相关性以及子图的元素(即实体)彼此的相关性。
根据该方法的优选实施例,该方法进一步包括计算数据相关性的步骤和/或计算内部相关性的步骤。
根据该方法的优选实施例,基于数据集的实体与子图的实体对之间的相关度来计算子图与数据集的数据相关性。
根据该方法的优选实施例,基于所述实体的类别的相似度、特别是类别类型,计算数据集的实体与子图的实体之间的相关度。
数据集的每个实体和子图的每个实体用它的类别类型来注释,该类别类型由标示,其中是例如在某个目录中给出的所有类别的集合。
为了计算两个实体vi、vj之间的相关度r(vi, vj),实体vi、vj被表示为由维向量空间给出的向量空间中的两个向量、,其中第l维对应于类别,并且计算该空间中两个向量、的余弦相似度:
。
对于向量、,考虑类别类型以及还有在子图中它们的邻居的类别类型。通过考虑邻居的类别类型,可以将隐式相关度考虑在内。
具体地,对于,即的第l维,定义下式
其中标示类型频率——tl相对于vi的反向实体频率。它将公知的术语频率——信息检索中的反向文档频率——适配于知识图:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110684997.7/2.html,转载请声明来源钻瓜专利网。