[发明专利]基于知识图谱的地点检索方法、设备及计算机存储介质有效
申请号: | 201910333290.4 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110059264B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 宋爱波;党永成;王波;陆廷骧;翟明玉;闪鑫 | 申请(专利权)人: | 东南大学;国电南瑞科技股份有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/9538;G06F16/29;G06F40/295;G06F40/30;G06N5/025 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 地点 检索 方法 设备 计算机 存储 介质 | ||
本发明公开了一种基于知识图谱的地点检索方法、设备及计算机存储介质,包括了建立索引方法和查询方法,考虑到空间和语义两个因素对查询结果的影响下,分别建立空间和语义索引并将其结合存储,设计了一种结合空间和语义信息的线性四叉树索引结构,并设计针对上述索引结构的高效查询算法。本发明针对传统KSP方法在知识图谱RDF无向图的海量数据下查询效率较低的不足,在保证查询结果精准度的同时提高在线地点查询的效率。实验证明本发明可以大幅提高知识图谱在线地点查询的效率。
技术领域
本发明涉及一种地点检索方法、设备及计算机存储介质,特别是涉及一种基于知识图谱的地点检索方法、设备及计算机存储介质。
背景技术
知识图谱中的知识以RDF数据模型进行表示,RDF将数据建模为实体并与其他实体或类型建立联系,即主语,谓语,宾语的三元组形式,主语和宾语都是实体,谓语表示两个实体的关系。每个实体有自己的全局ID,类型和文本描述,文本描述中存储了对应实体的相关描述和关键词集合,在RDF图中每个节点表示一个实体,每条边表示两个节点的关系。
用户的查询输入为自己所需的关键词集合,查询系统需要返回最符合用户语义需求的地点实体集。语义距离指待查询地点实体与用户实际查询需求间的语义关联程度,语义距离越小表示待查询实体越符合用户查询语义,在RDF图中通过待查询实体与包含用户查询关键词的节点最短距离之和表示。空间位置也是影响用户查询结果的重要因素,因此查询系统需要结合空间位置信息,空间距离为用户所在位置与待查询地点实体间空间地理位置的欧式距离。
KSP查询是根据空间距离依次找到距离用户较近的地点实体,对每个地点实体在RDF图中进行广度优先搜索,找到满足以下条件的子树:(1)根节点是一个地点实体(2)子树中的节点文本描述中包含了用户输入的关键词。如果满足上述条件,那么该地点实体便是符合用户语义需求的地点。再根据空间距离与语义距离进行代价函数综合排序,返回Top-k个地点实体集合。
传统KSP主要通过RDF有向图进行查询,无法完全的表达用户真实语义,在数据量较大的情况下,存储和计算开销较大,根据真实的语义信息可以发现,需要将数据图作为无向图进行查询,这将大大增加查询数据量,因此传统KSP方法无法高效率的对RDF无向图进行在线查询,同时其对于结果排序的代价判定方式也不够准确。图1是一个简单的地点查询示例,P1代表“北京”,P2代表“故宫”,V1代表“国家5A级景区”,图中(a)有RDF三元组北京,包含,故宫,故宫,属于,国家5A级景区,(b)中有三元组国家5A级景区,包含,故宫,故宫,属于,北京,可以发现(a)与(b)具有相同的语义,当用户待查找“包含5A级景区的城市”或“5A级景区涵盖哪个城市”应该返回P1“北京”这个相同的结果,传统KSP方法中只针对(a)或(b)进行查询,不能完全满足用户查询需求,可能出现无法理解用户语义的情况,因此为了在查询时保证可以查询到更符合用户语义的结果,需要将RDF有向图转换为RDF无向图。而目前的RDF无向图在海量数据下查询效率较低。
发明内容
发明目的:本发明要解决的技术问题是提供一种基于知识图谱的地点检索方法、设备及计算机存储介质,针对传统KSP方法在知识图谱RDF无向图的海量数据下查询效率较低的情况,根据空间与语义信息建立了高效的索引结构,提高了查询的效率。
技术方案:本发明所述的基于知识图谱的地点检索方法,包括建立索引方法和查询方法,
所述建立索引方法,包括以下步骤:
(1)在RDF图中以地点实体为根进行广度优先搜索,将该地点实体与其他节点的最短距离存储为语义距离索引;
(2)根据空间特性将整个数据空间进行迭代划分为若干个区域,对区域进行编码构建线性四叉树索引,并在所述四叉树的叶子结点中存储对应区域内的地点实体的语义距离索引信息;
所述查询方法,包括以下步骤:
(1)用户输入关键词集合以及用户位置坐标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学;国电南瑞科技股份有限公司,未经东南大学;国电南瑞科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910333290.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息提示方法、装置及车载终端设备
- 下一篇:用于处理信息的方法和设备