[发明专利]一种数据融合方法及装置在审

专利信息
申请号: 202010525808.7 申请日: 2020-06-10
公开(公告)号: CN111723172A 公开(公告)日: 2020-09-29
发明(设计)人: 方硕;刘婧文;李城 申请(专利权)人: 广东世纪高通科技有限公司
主分类号: G06F16/29 分类号: G06F16/29;G06F16/21
代理公司: 北京中博世达专利商标代理有限公司 11274 代理人: 申健
地址: 510000 广东省广州市天河区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 融合 方法 装置
【说明书】:

发明公开了一种数据融合方法及装置,涉及交通信息服务技术领域,解决了单个渠道获取的POI地址信息存在覆盖范围不全、数据质量不高的问题。具体方案包括:数据融合装置获取至少两种POI数据源中每种POI数据源的POI地址信息,得到初始POI地址信息集合,POI地址信息用于表示地理实体的位置信息;对初始POI地址信息集合包括的POI地址信息进行融合,得到目标POI地址信息集合,目标POI地址信息集合包括多条有效的目标POI地址信息;将目标POI地址信息集合包括的目标POI地址信息加载入地址信息数据库。

技术领域

本发明涉及交通信息服务技术领域,尤其涉及一种数据融合方法及装置。

背景技术

兴趣点(point of interest,POI)地址信息是对具体的地理实体的标注,代表着该地理实体的特定地理位置。实际应用中,POI地址信息与经济社会活动和人民群众日常生活密切相关,涉及经济生活、社会交往、城市建设和治安管理等诸多方面。

在相关技术中,一个地理实体的POI地址信息可以从不同的渠道获取,例如,可以从公安网、互联网应用等获取。但是,单个渠道获取的POI地址信息均存在覆盖范围不全、数据质量不高的问题。

发明内容

本发明提供一种数据融合方法及装置,解决了单个渠道获取的POI地址信息存在覆盖范围不全、数据质量不高的问题。

为达到上述目的,本发明采用如下技术方案:

第一方面,本发明提供一种数据融合方法,该方法包括:数据融合装置获取至少两种POI数据源中每种POI数据源的POI地址信息,得到初始POI地址信息集合,POI地址信息用于表示地理实体的位置信息;对初始POI地址信息集合包括的POI地址信息进行融合,得到目标POI地址信息集合,目标POI地址信息集合包括多条有效的目标POI地址信息;将目标POI地址信息集合包括的目标POI地址信息加载入地址信息数据库。

结合第一方面,在一种可能的实现方式中,对初始POI地址信息集合包括的POI地址信息进行融合,得到目标POI地址信息集合,具体可以包括:对初始POI地址信息集合包括的POI地址信息进行清洗和加工,得到候选POI地址信息集合;将候选POI地址信息集合包括的每条POI地址信息按照预设地址结构进行转换,得到目标POI地址信息集合。

结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,对初始POI地址信息集合包括的POI地址信息进行清洗和加工,得到候选POI地址信息集合,具体可以包括:将初始POI地址信息集合按照行政区划等级进行分类,去除每类POI地址信息中的异常POI地址信息,得到第一POI地址信息集合;将第一POI地址信息集合包括的每条POI地址信息进行切分,得到多个切片信息;确定多个切片信息中的异常切片信息,去除第一POI地址信息集合中包含异常切片信息的POI地址信息,得到第二POI地址信息集合;对第二POI地址信息集合进行清洗和加工,得到候选POI地址信息集合。

结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,对第二POI地址信息集合进行清洗和加工,得到候选POI地址信息集合,具体可以包括:从去除异常切片信息后的切片信息中获取地理实体的名称,并将第二POI地址信息集合中,包含相同名称的所有POI地址信息进行清洗和加工,得到候选POI地址信息集合。

结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,对第二POI地址信息集合进行清洗和加工,得到候选POI地址信息集合,具体可以包括:在去除异常切片信息后的切片信息中,将表示同一地理实体的切片信息合并为分词,并将包含分词的POI地址信息进行合并;确定分词的类型,并根据分词的类型,对合并后的POI地址信息进行清洗和加工,得到候选POI地址信息集合。

结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,还包括:响应于用户的输入操作,在地址信息数据库中按照预设地址结构,增加POI地址信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东世纪高通科技有限公司,未经广东世纪高通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010525808.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top