[发明专利]一种基于网络消息的地理空间坐标信息获取方法及装置在审

专利信息
申请号: 202110255689.2 申请日: 2021-03-09
公开(公告)号: CN112836146A 公开(公告)日: 2021-05-25
发明(设计)人: 梁志承 申请(专利权)人: 威创集团股份有限公司
主分类号: G06F16/9537 分类号: G06F16/9537;G06F16/29;G06F40/295
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 许庆胜
地址: 510670 广东省广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 网络 消息 地理 空间 坐标 信息 获取 方法 装置
【说明书】:

本申请公开了一种基于网络消息的地理空间坐标信息获取方法及装置。包括:通过网络爬取方式,获取网络消息文本;采用文本分词处理技术,对网络消息文本进行实体词分词处理,并将分词处理后得到的实体词输入至地名分类匹配模型,以通过地名分类匹配模型的分类匹配运算,得到地名地址信息;根据地名地址信息,通过地理编码方式,将地名地址信息转换为地理空间坐标信息。实现了对因不包含地理标记而无法直接得到地理空间坐标信息等网络数据的地理空间坐标信息的获取,解决了现有的基于网络消息的地理空间坐标信息获取成功率低的技术问题。

技术领域

本申请涉及网络信息处理技术领域,尤其涉及一种基于网络消息的地理空间坐标信息获取方法及装置。

背景技术

近几年,随着科技的不断发展,越来越多的地理信息产业渗透到经济社会和人民日常生活的各个领域。尤其是互联网领域,由于互联网有着海量数据,其中大多数采用文本描述。同时,文本描述的事件大多与空间位置信息相关。如2019年疫情背景下,社交媒体公布的病人轨迹信息。目前对网络上的地理空间坐标信息提取方式通常为通过爬虫技术获取网络消息中的地理标记,以根据地理标记解析并提取地理空间坐标信息,但对于不包含地理标记的网络消息则无法提取地理空间坐标信息,导致了现有的基于网络消息的地理空间坐标信息获取成功率低的技术问题。

发明内容

本申请提供了一种基于网络消息的地理空间坐标信息获取方法及装置,用于解决现有的基于网络消息的地理空间坐标信息获取成功率低的技术问题。

本申请第一方面提供了一种基于网络消息的地理空间坐标信息获取方法,包括:

通过网络爬取方式,获取网络消息文本;

通过文本分词处理方式,对所述网络消息文本进行实体词分词处理,并将分词处理后得到的实体词输入至地名分类匹配模型,以通过所述地名分类匹配模型的分类匹配运算,得到地名地址信息,其中,所述地名分类匹配模型为通过预设的地名词典训练集,结合隐马尔可夫模型、Viterbi算法以及AC算法训练得到的;

根据所述地名地址信息,通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息。

优选地,所述将分词处理后得到的实体词输入至地名分类匹配模型之前还包括:

将分词处理后得到的实体词与预设的地名词典信息进行信息匹配,若匹配成功,则输出匹配到的地名地址信息,以通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息,若匹配不成功,则将所述实体词输入至地名分类匹配模型。

优选地,所述根据所述地名地址信息,通过地理编码方式,将所述地名地址信息转换为地理空间坐标信息之后还包括:

若上述步骤未获取到地理空间坐标信息,则根据所述地名地址信息,结合文本来源用户的兴趣点,通过地理加权回归分析方式,计算所述地名地址信息与各个所述兴趣点的莫兰指数,其中,所述文本来源用户为发布所述网络消息文本的用户,所述兴趣点的获取方式为:根据所述文本来源用户的历史地址记录,确定所述文本来源用户的历史活动区域,并以所述历史活动区域内的地名地址信息确定所述兴趣点;

根据莫兰指数计算结果,确定与所述地名地址信息相关度最高的目标兴趣点,以根据所述目标兴趣点的地名地址信息,通过地理编码方式转换为地理空间坐标信息。

优选地,还包括:

获取地图服务,并在所述地图服务中加载所述地理空间坐标信息。

优选地,所述地图服务具体为三维地图服务。

本申请第二方面提供了一种基于网络消息的地理空间坐标信息获取装置,包括:

消息文本爬取单元,用于通过网络爬取方式,获取网络消息文本;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于威创集团股份有限公司,未经威创集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110255689.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top