[发明专利]知识图谱标签松散场景下地理信息索引系统及检索方法有效
申请号: | 202011048405.4 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112214612B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 龙万成;王丽苹 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31;G06F16/29;G06F16/9537 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 标签 松散 场景 地理信息 索引 系统 检索 方法 | ||
本发明公开了一种知识图谱标签松散场景下地理信息索引系统及检索方法,该地理信息索引系统在存储地理信息的同时额外存储了知识图谱中每一个地理节点所关联的标签的集合,其对应的检索方法可以利用索引系统中存储的标签集合信息直接查询出所有与对应地理节点所关联的标签并检测出这些标签是否满足检索需求,从而提前规避对不满足检索需求的地理节点的检索,减小了无效检索的范围。本发明提出的地理信息索引系统及对应检索方法在知识图谱标签松散场景下可以表现出高效的检索效率。
技术领域
本发明涉及计算机科学技术领域,尤其是一种知识图谱标签松散场景下地理信息索引系统及对应检索方法。
背景技术
国际标准化组织W3C提出了针对RDF知识图谱的标准化查询语言SPARQL。作为一种图数据,SPARQL查询的执行可以通过图匹配的方式实现。然而图匹配的计算复杂度较高,关于查询的执行和实现,核心问题是在保证接口正确性的同时,如何有效地提高时间效率和空间效率;针对这些核心问题,合理的模型和算法的设计,对于知识图谱的高效查询来说,是必不可少的。
针对时空数据和文本关键词的查询,目前已经取得了较好的进展,如IR-Tree,BR-Tree等;它们的主要思想都是在空间索引中维护其他额外的关键信息(如文本关键词信息等),以此在基于空间索引的空间剪枝的能力的基础上,增加额外的剪枝能力(如文本剪枝能力),最终有效地提高查询的效率;但是,正是由于在空间索引中维护了额外的信息,所以为了维护这些额外的信息而导致的空间上的开销,也是需要考虑和权衡的。除此之外,由于在知识图谱中数据是以节点(图数据)的形式存在,其时空信息和文件关键词信息是以节点的属性或独立的节点的形式存在,所以对于如何厘清不同粒度的空间实体和文本等非空间实体的逻辑关联关系、如何有效地利用地理关联技术去关联知识图谱中实体的语义信息和空间信息、如何有效地将时空数据和文本关键词的查询相关的高效算法应用于知识图谱中等等难点,仍具有一定的思考和研究的空间。
基础地理信息数据具有空间载体和知识库两大功能。过去人们主要关注其空间载体的作用,开发并提供各种基础地理数据服务和信息服务,但对其知识存量的挖掘不够,提供的地理空间知识服务很少。近年来,“海量数据、信息爆炸、知识难求”的现象越来越突出,以在知识图谱中对地理信息进行额外的处理以获得更好的知识服务为起点,将地理数据信息服务向知识服务转型是大势所趋。如果能够在知识图谱中以结构化的方式描述伴随着地理空间信息的高维度数据及其间的关系并实现高效的查询,则对于在认知计算、知识表示与推理、信息检索与抽取、数据挖掘与机器学习等大数据技术对地理信息进行处理与分析以及地理信息知识服务方面将会大有裨益。由此,知识图谱中地理信息的存储与高效查询的实现,对于地理信息的分析与应用来说,具有重要的研究和实用价值。
此外,从流行病防治的需求出发,可以结合图数据与时空数据等大数据管理技术,利用知识图谱全面刻画疫情中涉及的医疗、社会、人群等复杂信息,用轨迹数据刻画用户随时间变化的位置信息,并建立时空数据与知识图谱中文本数据的关联,进而构建融合知识图谱和时空数据的新颖有效的存储、处理和分析技术,实现疫情的全方位、细粒度、多视角的监控,并为现有的人工管理和直报系统提供有力补充。
发明内容
本发明的目的是提供一种知识图谱标签松散场景下地理信息索引系统及检索方法,该地理信息索引系统在存储地理信息的同时额外存储了知识图谱中每一个地理节点所关联的标签的集合,其对应的检索方法可以利用索引系统中存储的标签集合信息直接查询出所有与对应地理节点所关联的标签并检测出这些标签是否满足检索需求,从而提前规避对不满足检索需求的地理节点的检索,减小了无效检索的范围。
实现本发明目的的具体技术方案是:
一种知识图谱标签松散场景下地理信息索引系统,特点是所述索引系统为LR树;所述LR树以R树为基础,在存储空间信息的同时,再存储每个节点的可达标签集合,以增强检索时剪枝效力;
其中可达标签集合具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011048405.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于人体行走的发电装置
- 下一篇:一种多功能螺丝刀