[发明专利]在知识图谱上进行关键字搜索的方法和系统在审
申请号: | 202110405201.X | 申请日: | 2021-04-15 |
公开(公告)号: | CN113535890A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | E·卡尔拉莫夫 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 郭美琪;周学斌 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 进行 关键字 搜索 方法 系统 | ||
用于在知识图谱上进行关键字搜索的计算机实现的方法,其中,知识图谱包括表示实体的大量顶点和表示所述实体之间的关系的大量边缘,并且知识图谱利用静态标签进行增强,其中,每个顶点的静态标签包括所述特定顶点与知识图谱的其他顶点之间距离的列表,其中,方法包括以下步骤:接收关键字的集合,基于该关键字集合来构造动态标签,并且基于静态标签且基于动态标签来为关键字的集合确定知识图谱的子图谱,其中,构造动态标签的步骤包括以下步骤:通过将关键字的集合中的关键字映射到知识图谱的顶点来获得关键字顶点,以及从静态标签为关键字顶点获得关键字顶点与关键字顶点的前身之间的距离。
技术领域
本公开涉及一种用于在知识图谱(knowledge graph)上进行关键字搜索的计算机实现的方法和系统。
背景技术
关键字搜索允许用户查询数据,而无需事先了解专门的查询语言。关键字查询是用户提出的、应该与数据相匹配的单词集合。然后提取相关的数据片段,并且以适当的格式将其呈现给用户作为答案。匹配关键字、提取数据和编写答案的确切方法取决于基础数据的格式和查询回答的语义。
知识图谱主要被用于通过描述(真实世界)实体及其关系来进行基于图谱的知识表示。知识图谱包括表示实体的大量顶点和表示实体之间的关系的大量边缘。
用于在图谱数据上进行关键字查询的一种常见的语义类型是将每个关键字与图谱的顶点相匹配,并且提取包含这些顶点的具有最小权重的树,称为最小权重Steiner树,如Stefan Voß,1992年的“Steiner’s Problem in Graphs: Heuristic Methods(Discr.Appl. Math. 40,1(1992),45-72)”中所述。
在边缘加权数据图谱和关键字查询中,人们首先为每个关键字找到图谱中匹配的顶点集合,即,可以匹配该关键字的所有顶点,然后在图谱中找到包括(span)该匹配集合的树,即,包含来自每个匹配集合的至少一个顶点,并且使总边缘权重最小化。此优化问题是众所周知的群组Steiner树(GST)问题,如Stefan Voß,1992年的“Steiner’s Problem inGraphs: Heuristic Methods(Discr. Appl. Math. 40,1(1992),45-72)”中所述。关键字也被允许与边缘进行匹配。边缘匹配可以经由图谱细分(subdivision)直接变换成顶点匹配,并且作为顶点匹配进行处理。
在GST语义下计算对关键字查询的答案在计算上要求很高。此外,对于大型图谱,具有可证明质量保证的现有近似算法也具有过分高的运行时间。近年来,知识图谱变得越来越流行,并且它们可能非常庞大。本公开的目的是在知识图谱上提供有效的关键字搜索系统和方法。
发明内容
这通过根据独立权利要求的设备和方法来实现。
一个实施例涉及一种用于在知识图谱上进行关键字搜索的计算机实现的方法,其中,知识图谱包括表示实体的大量顶点和表示所述实体之间的关系的大量边缘,并且知识图谱利用静态标签进行增强,其中,每个顶点的静态标签包括所述特定顶点与知识图谱的其他顶点之间距离的列表,其中,该方法包括以下步骤:接收关键字集合,基于该关键字集合来构造动态标签,并且基于静态标签且基于动态标签来为该关键字集合确定知识图谱的子图谱,其中,构造动态标签的步骤包括以下步骤:通过将关键字集合中的关键字映射到知识图谱的顶点来获得关键字顶点,以及从静态标签为关键字顶点获得关键字顶点与关键字顶点的前身之间的距离。
在本公开的上下文中,静态标签被称为离线构造的索引结构。
优选地,每个顶点的静态标签包括:所述特定顶点与知识图谱的其他顶点之间距离的列表,其中,该距离关于顶点的中间中心性(betweenness centrality)以降序排序,从到顶点的距离开始,该顶点具有指向(point in)和指出(point out)所述顶点的最大数量的边缘。
顶点v的中间中心性bc被定义为
,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110405201.X/2.html,转载请声明来源钻瓜专利网。