[发明专利]一种兴趣点POI数据的处理方法及装置在审

专利信息
申请号: 201410749154.0 申请日: 2014-12-09
公开(公告)号: CN105740252A 公开(公告)日: 2016-07-06
发明(设计)人: 史川 申请(专利权)人: 北京四维图新科技股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京银龙知识产权代理有限公司 11243 代理人: 许静;黄灿
地址: 100028 北京市朝阳区曙光西里甲*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 兴趣 poi 数据 处理 方法 装置
【说明书】:

技术领域

发明涉及POI技术领域,特别是指一种兴趣点POI数据的处理方法及装置。

背景技术

现有技术在对比两个兴趣点POI(比如咖啡馆、银行、饭馆等)是否重复时,直接按照纯文字的相似度来判断二者的名称和地址是否重复。上述比较方法存在以下问题:(1)名称比较存在较大误差,尤其是存在歧义、错别字和简称等情形下;(2)在地址不确定的情况下,无法对连锁品牌进行比较。

现有差分基准库中,每年新增的数据成千上万,采集的数据又是多源的,为了保证新增数据质量,有必要对新增的POI数据进行精确地去重处理。

发明内容

本发明的目的在于提供一种兴趣点POI数据的处理方法及装置,用以解决差分基准库中新增的POI数据,可能会与差分基准库中已有的POI数据重复,难以保证新增数据质量的问题。

为了实现上述目的,本发明提供了一种兴趣点POI数据的处理方法,包括:

根据新增POI的坐标生成缓冲区,并将所述缓冲区和差分基准库进行叠加,获取所述缓冲区内所有的基准库POI;

在所述基准库POI中,获取所有的与所述新增POI的类别相同的第一POI;

若所述第一POI中存在一个与所述新增POI的第一联系方式信息相同的第二POI,则确定不将所述新增POI添加到所述差分基准库中,否则,根据所述新增POI的第二联系方式信息,获取每个所述第一POI与所述新增POI的相似度;

若每个所述第一POI与所述新增POI的相似度均小于一预设阀值,则将所述新增POI添加到所述差分基准库中。

其中,所述第二联系方式信息包括:名称和地址,相应地,所述根据所述新增POI的第二联系方式信息,获取每个所述第一POI与所述新增POI的相似度的步骤包括:

为所述新增POI的名称分配第一权重,同时为所述新增POI的地址分配第二权重;

获取所述第一POI的名称与所述新增POI的名称的第一相似度;

获取所述第一POI的地址与所述新增POI的地址的第二相似度;

将所述第一相似度与所述第一权重的乘积以及所述第二相似度与所述第二权重的乘积进行求和运算,得出所述第一POI与所述新增POI的相似度。

其中,所述获取所述第一POI的名称与所述新增POI的名称的第一相似度的步骤包括:

若所述第一POI的名称与所述新增POI的名称的字符个数相等,则根据编辑距离算法,得出所述第一POI的名称与所述新增POI的名称的第一相似度;

若所述第一POI的名称与所述新增POI的名称的字符个数不相等,则选取所述第一POI的名称与所述新增POI的名称中字符个数较多的名称作为第一比较例,选取所述第一POI的名称与所述新增POI的名称中字符个数较少的名称作为第二比较例,其中,所述第一比较例包含M个字符,所述第二比较例包含N个字符,M大于N且M、N为整数;

以所述第一比较例中的第X个字符为起始,在所述第一比较例中选取N个连续排列的字符作为待比较字符,其中,X为大于或者等于1的奇数;

将所述待比较字符与所述第二比较例进行比较,得出所述待比较字符与所述第二比较例的相似值;

选取所述相似值中最大的值作为所述第一相似度。

其中,所述获取所述第一POI的地址与所述新增POI的地址的第二相似度的步骤包括:

若所述第一POI的地址与所述新增POI的地址中存在相同的POI,则根据所述新增POI的地址中的道路名称以及门牌号确定所述第二相似度,否则,确定所述第二相似度为第一预设值。

其中,根据所述新增POI的地址中的道路名称以及门牌号确定所述第二相似度的步骤包括:

若所述第一POI的地址与所述新增POI的地址中存在相同的道路名称,则确定所述第一POI的道路名称与所述新增POI的道路名称的第一子相似度为第二预设值,并获取所述第一POI中的门牌号与所述新增POI的地址中的门牌号的第二子相似度,否则,根据编辑距离算法,获取所述第一POI的道路名称与所述新增POI的道路名称的第一子相似度,并将所述第一子相似度作为所述第二相似度;

将所述第一子相似度与所述第二子相似度进行求和运算,得出所述第二相似度。

本发明的实施例还提供了一种兴趣点POI数据的处理装置,包括:

第一获取模块,用于根据新增POI的坐标生成缓冲区,并将所述缓冲区和差分基准库进行叠加,获取所述缓冲区内所有的基准库POI;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京四维图新科技股份有限公司,未经北京四维图新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410749154.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top