[发明专利]提取地理位置点空间关系的方法、训练提取模型的方法及装置有效
申请号: | 202010438214.2 | 申请日: | 2020-05-21 |
公开(公告)号: | CN111737383B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 黄际洲;王海峰;张伟;范淼 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/909;G06F16/9537 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提取 地理位置 空间 关系 方法 训练 模型 装置 | ||
本申请公开了一种提取地理位置点空间关系的方法、训练提取模型的方法及装置,涉及大数据技术领域。具体实现方案为:获取第二训练数据,所述第二训练数据包括:文本以及对文本中地理位置点、地理位置点空间关系信息的标注;利用所述第二训练数据训练地理位置点空间关系提取模型,所述地理位置点空间关系提取模型包括嵌入层、Transformer层和映射层;所述地理位置点空间关系提取模型用于从输入的文本中提取地理位置点空间关系信息。本申请能够从互联网文本中提取地理位置点空间关系信息,解决了因地理位置点的坐标误差或楼层关系而导致的空间关系不准确或无法自动生成的问题。
技术领域
本申请涉及计算机应用技术领域,特别涉及大数据技术领域。
背景技术
地图主要的目标就是刻画真实世界,让用户的出行更简单。地理位置点的高精知识图谱是满足用户在地图找点和出行等核心诉求的基础。而地理位置点空间关系是知识图谱的必备要素之一,可以实现更准确的逻辑推理查询。
目前,挖掘地理位置点空间关系的一种方法是利用地理位置点的坐标自动生成,但是该方法依赖坐标的准确度,而地理位置点的坐标误差一般在几十米甚至百米以上,导致该方法生成的地理位置点空间关系不准确。特别是楼层关系,无法通过坐标自动生成。
发明内容
有鉴于此,本申请通过以下技术方案解决现有技术中的上述技术问题。
第一方面,本申请提供了一种训练地理位置点空间关系提取模型的方法,该方法包括:
获取第二训练数据,所述第二训练数据包括:文本以及对文本中地理位置点、地理位置点空间关系信息的标注;
利用所述第二训练数据训练地理位置点空间关系提取模型,所述地理位置点空间关系提取模型包括嵌入层、Transformer层和映射层;
所述地理位置点空间关系提取模型用于从输入的互联网文本中提取地理位置点空间关系信息。
第二方面,本申请还提供了一种提取地理位置点空间关系的方法,该方法包括:
从互联网获取包含地理位置点信息的文本;
将所述文本输入预先训练得到的地理位置点空间关系提取模型,获取所述地理位置点空间关系提取模型输出的空间关系的信息;其中所述地理位置空间关系提取模型包括嵌入层、Transformer层和映射层。
第三方面,本申请提供了一种训练地理位置点空间关系提取模型的装置,该装置包括:
第二获取单元,用于获取第二训练数据,所述第二训练数据包括:文本以及对文本中地理位置点、地理位置点空间关系信息的标注;
第二训练单元,用于利用所述第二训练数据训练地理位置点空间关系提取模型,所述地理位置点空间关系提取模型包括嵌入层、Transformer层和映射层;
所述地理位置点空间关系提取模型用于从输入的文本中提取地理位置点空间关系信息。
第四方面,本申请还提供了一种提取地理位置点空间关系的装置,该装置包括:
获取单元,用于从互联网获取包含地理位置点信息的文本;
提取单元,用于将所述文本输入预先训练得到的地理位置点空间关系提取模型,获取所述地理位置点空间关系提取模型输出的空间关系的信息;其中所述地理位置空间关系提取模型包括嵌入层、Transformer层和映射层。
第五方面,本申请提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010438214.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于电力维修的维修车
- 下一篇:一种快速均匀的动态混气装置