[发明专利]一种基于知识图谱的空间关系语义分析的方法在审

专利信息
申请号: 202210208390.6 申请日: 2022-03-04
公开(公告)号: CN114564966A 公开(公告)日: 2022-05-31
发明(设计)人: 许珺;胡蕾 申请(专利权)人: 中国科学院地理科学与资源研究所
主分类号: G06F40/30 分类号: G06F40/30;G06F16/36
代理公司: 成都宏田知识产权代理事务所(普通合伙) 51337 代理人: 常利敏
地址: 100101 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 图谱 空间 关系 语义 分析 方法
【说明书】:

发明涉及语义分析领域,公开了一种基于知识图谱的空间关系语义分析的方法,具体包括:从大规模语料库中提取地理实体及其关系表达,并通过语义计算的方法对地理实体及其关系描述进行语义量化,结合地理实体类型分析地理实体和关系表达之间的对应关系,以及地理实体/关系描述的相似性、相异性,最后结合空间关系的几何定性/定量化模型,细化空间关系语义的几何特征。实施本发明有利于丰富空间关系的自然语言表达,提升地理实体‑关系三元组的链接预测效果,通过融合地理实体类型,增强地名与关系描述的嵌入结果,使得能够更准确地预测地名和空间关系。

技术领域

本发明涉及语义分析领域,尤其涉及一种基于知识图谱的空间关系语义分析的方法。

背景技术

空间关系作为人们认知现实地理空间的重要组成,成为了地理信息系统(GIS)研究的 主要内容,其研究进展直接影响着空间数据模型、空间数据库查询、空间分析、空间推理 制图综合、地图理解、自然语言界面标准化等方面的研究发展和应用。大多数情况下,GIS 用户可以用图形和数字量化拓扑,距离以及方向关系,但除此之外更广泛的空间关系则存 在于用户的认知和语言表达当中。20世纪九十年代,美国国家地理信息分析中心(NCGIA) 将空间关系的自然语言表达作为重要议题之一,旨在通过形式化更真实的神经认知来处理 地理信息的语义,从而将其应用于地理信息科学。在此研究议题下,Egenhofer和Mark进 一步提出了“朴素地理学”的概念,它被定义为人们具有的对周围地理世界的知识,这些 知识中包含着一套遵循人类认知直觉的理论体系,可利用于地理信息系统的设计从而使得 非专业GIS用户更易使用。从空间关系的语义表达的角度来看,这些直觉中包括人类对地 理空间的几何认知,地物本身具有的语义特征、地物抽象类型等非几何属性,相对于基于 坐标的空间关系计算,这种高度抽象概念化的空间关系描述更为模糊和不确定,但却更接 近人们的使用习惯以及认知过程。

为了建立GIS系统与人类空间认知表达之间的语义映射,研究者们通过进行认知实验, 开发设计本体,建立地理语义网(Semantic Web)等手段加以实现,但受制于语义研究方 法以及数据来源,对于空间关系的语义研究有限,随着自然语言处理技术以及链接数据 (Geo Linked Data)的不断发展和完善,语义计算成为了我们进一步理解文本表达的新视 角,再加上大量可获取的自然语言描述,一方面从统计的角度,便于分析人们对不同地理 实体所使用的不同空间关系描述,另一方面从计算的角度,便于结合各种外在因子计算空 间关系描述的差别与相似之处。在大数据时代,人们的语言表达被大量采集记录,形成了 各种各样的不同领域不同语言的文本语料库,即主题不限,内容不限的开放域,这些文本 中蕴含着人们对所生活的现实环境的大量且多种的地理空间描述,这对研究自然语言中的 空间关系语义的识别提供了巨大的数据支持。此外,深度学习以及自然语言处理(NLP)技 术的出现与飞速发展也为空间关系的语义研究提供了巨大的便利,使得自然语言可计算和 度量,比如Word2vec模型已经可以通过训练得到“Germany-Berlin+France=Paris” 这样隐含空间关系的语义关系,我们可以深入考虑应用这些技术来发现更多的空间关系。 但是如何从巨大的结构化、半结构化以及非结构化文本中提取并有效组织地理信息,知识 图谱的出现提供了一种有效的解决思路,首先,RDF三元组的数据组织形式可以明确描述 地理实体与空间关系,此外在知识图上发展的一系列技术手段也有助于分析地理实体及其 对应的空间关系描述。

而现有技术中研究者为了描述地理实体及其关系,起初将空间关系描述局限在单一的 空间关系上,存在表达位置信息不足的问题,之后研究者尝试组合多种空间关系进行描述, 张珂等人基于四叉树直方图来描述空间方向关系或细节方向关系,之后根据不同的应用人 工建立在外部参考框架下的空间方向关系词和程度修饰词词典,并基于模糊规则选取适当 的方向关系词,程度修饰词和距离关系词生成类似人的空间关系自然语言描述;对于电子 地图导航中常用的路径描述,张雪英等人通过人工收集词汇库,建立描述句法模式以及获 取路径补充信息,基于路径的方向判断生成自然语言路径描述,张彩丽等人通过分解移动 点的运动轨迹,描述移动点与参考物的拓扑关系,之后综合考虑整个轨迹与地物间的方向 关系和距离关系,进行集成描述。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院地理科学与资源研究所,未经中国科学院地理科学与资源研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210208390.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top