[发明专利]一种数据融合方法及装置在审
申请号: | 202010525808.7 | 申请日: | 2020-06-10 |
公开(公告)号: | CN111723172A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 方硕;刘婧文;李城 | 申请(专利权)人: | 广东世纪高通科技有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/21 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 510000 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 融合 方法 装置 | ||
本发明公开了一种数据融合方法及装置,涉及交通信息服务技术领域,解决了单个渠道获取的POI地址信息存在覆盖范围不全、数据质量不高的问题。具体方案包括:数据融合装置获取至少两种POI数据源中每种POI数据源的POI地址信息,得到初始POI地址信息集合,POI地址信息用于表示地理实体的位置信息;对初始POI地址信息集合包括的POI地址信息进行融合,得到目标POI地址信息集合,目标POI地址信息集合包括多条有效的目标POI地址信息;将目标POI地址信息集合包括的目标POI地址信息加载入地址信息数据库。
技术领域
本发明涉及交通信息服务技术领域,尤其涉及一种数据融合方法及装置。
背景技术
兴趣点(point of interest,POI)地址信息是对具体的地理实体的标注,代表着该地理实体的特定地理位置。实际应用中,POI地址信息与经济社会活动和人民群众日常生活密切相关,涉及经济生活、社会交往、城市建设和治安管理等诸多方面。
在相关技术中,一个地理实体的POI地址信息可以从不同的渠道获取,例如,可以从公安网、互联网应用等获取。但是,单个渠道获取的POI地址信息均存在覆盖范围不全、数据质量不高的问题。
发明内容
本发明提供一种数据融合方法及装置,解决了单个渠道获取的POI地址信息存在覆盖范围不全、数据质量不高的问题。
为达到上述目的,本发明采用如下技术方案:
第一方面,本发明提供一种数据融合方法,该方法包括:数据融合装置获取至少两种POI数据源中每种POI数据源的POI地址信息,得到初始POI地址信息集合,POI地址信息用于表示地理实体的位置信息;对初始POI地址信息集合包括的POI地址信息进行融合,得到目标POI地址信息集合,目标POI地址信息集合包括多条有效的目标POI地址信息;将目标POI地址信息集合包括的目标POI地址信息加载入地址信息数据库。
结合第一方面,在一种可能的实现方式中,对初始POI地址信息集合包括的POI地址信息进行融合,得到目标POI地址信息集合,具体可以包括:对初始POI地址信息集合包括的POI地址信息进行清洗和加工,得到候选POI地址信息集合;将候选POI地址信息集合包括的每条POI地址信息按照预设地址结构进行转换,得到目标POI地址信息集合。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,对初始POI地址信息集合包括的POI地址信息进行清洗和加工,得到候选POI地址信息集合,具体可以包括:将初始POI地址信息集合按照行政区划等级进行分类,去除每类POI地址信息中的异常POI地址信息,得到第一POI地址信息集合;将第一POI地址信息集合包括的每条POI地址信息进行切分,得到多个切片信息;确定多个切片信息中的异常切片信息,去除第一POI地址信息集合中包含异常切片信息的POI地址信息,得到第二POI地址信息集合;对第二POI地址信息集合进行清洗和加工,得到候选POI地址信息集合。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,对第二POI地址信息集合进行清洗和加工,得到候选POI地址信息集合,具体可以包括:从去除异常切片信息后的切片信息中获取地理实体的名称,并将第二POI地址信息集合中,包含相同名称的所有POI地址信息进行清洗和加工,得到候选POI地址信息集合。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,对第二POI地址信息集合进行清洗和加工,得到候选POI地址信息集合,具体可以包括:在去除异常切片信息后的切片信息中,将表示同一地理实体的切片信息合并为分词,并将包含分词的POI地址信息进行合并;确定分词的类型,并根据分词的类型,对合并后的POI地址信息进行清洗和加工,得到候选POI地址信息集合。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,还包括:响应于用户的输入操作,在地址信息数据库中按照预设地址结构,增加POI地址信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东世纪高通科技有限公司,未经广东世纪高通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010525808.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置