[发明专利]一种兴趣点POI数据的处理方法及装置在审
申请号: | 201410749154.0 | 申请日: | 2014-12-09 |
公开(公告)号: | CN105740252A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 史川 | 申请(专利权)人: | 北京四维图新科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 100028 北京市朝阳区曙光西里甲*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 兴趣 poi 数据 处理 方法 装置 | ||
技术领域
本发明涉及POI技术领域,特别是指一种兴趣点POI数据的处理方法及装置。
背景技术
现有技术在对比两个兴趣点POI(比如咖啡馆、银行、饭馆等)是否重复时,直接按照纯文字的相似度来判断二者的名称和地址是否重复。上述比较方法存在以下问题:(1)名称比较存在较大误差,尤其是存在歧义、错别字和简称等情形下;(2)在地址不确定的情况下,无法对连锁品牌进行比较。
现有差分基准库中,每年新增的数据成千上万,采集的数据又是多源的,为了保证新增数据质量,有必要对新增的POI数据进行精确地去重处理。
发明内容
本发明的目的在于提供一种兴趣点POI数据的处理方法及装置,用以解决差分基准库中新增的POI数据,可能会与差分基准库中已有的POI数据重复,难以保证新增数据质量的问题。
为了实现上述目的,本发明提供了一种兴趣点POI数据的处理方法,包括:
根据新增POI的坐标生成缓冲区,并将所述缓冲区和差分基准库进行叠加,获取所述缓冲区内所有的基准库POI;
在所述基准库POI中,获取所有的与所述新增POI的类别相同的第一POI;
若所述第一POI中存在一个与所述新增POI的第一联系方式信息相同的第二POI,则确定不将所述新增POI添加到所述差分基准库中,否则,根据所述新增POI的第二联系方式信息,获取每个所述第一POI与所述新增POI的相似度;
若每个所述第一POI与所述新增POI的相似度均小于一预设阀值,则将所述新增POI添加到所述差分基准库中。
其中,所述第二联系方式信息包括:名称和地址,相应地,所述根据所述新增POI的第二联系方式信息,获取每个所述第一POI与所述新增POI的相似度的步骤包括:
为所述新增POI的名称分配第一权重,同时为所述新增POI的地址分配第二权重;
获取所述第一POI的名称与所述新增POI的名称的第一相似度;
获取所述第一POI的地址与所述新增POI的地址的第二相似度;
将所述第一相似度与所述第一权重的乘积以及所述第二相似度与所述第二权重的乘积进行求和运算,得出所述第一POI与所述新增POI的相似度。
其中,所述获取所述第一POI的名称与所述新增POI的名称的第一相似度的步骤包括:
若所述第一POI的名称与所述新增POI的名称的字符个数相等,则根据编辑距离算法,得出所述第一POI的名称与所述新增POI的名称的第一相似度;
若所述第一POI的名称与所述新增POI的名称的字符个数不相等,则选取所述第一POI的名称与所述新增POI的名称中字符个数较多的名称作为第一比较例,选取所述第一POI的名称与所述新增POI的名称中字符个数较少的名称作为第二比较例,其中,所述第一比较例包含M个字符,所述第二比较例包含N个字符,M大于N且M、N为整数;
以所述第一比较例中的第X个字符为起始,在所述第一比较例中选取N个连续排列的字符作为待比较字符,其中,X为大于或者等于1的奇数;
将所述待比较字符与所述第二比较例进行比较,得出所述待比较字符与所述第二比较例的相似值;
选取所述相似值中最大的值作为所述第一相似度。
其中,所述获取所述第一POI的地址与所述新增POI的地址的第二相似度的步骤包括:
若所述第一POI的地址与所述新增POI的地址中存在相同的POI,则根据所述新增POI的地址中的道路名称以及门牌号确定所述第二相似度,否则,确定所述第二相似度为第一预设值。
其中,根据所述新增POI的地址中的道路名称以及门牌号确定所述第二相似度的步骤包括:
若所述第一POI的地址与所述新增POI的地址中存在相同的道路名称,则确定所述第一POI的道路名称与所述新增POI的道路名称的第一子相似度为第二预设值,并获取所述第一POI中的门牌号与所述新增POI的地址中的门牌号的第二子相似度,否则,根据编辑距离算法,获取所述第一POI的道路名称与所述新增POI的道路名称的第一子相似度,并将所述第一子相似度作为所述第二相似度;
将所述第一子相似度与所述第二子相似度进行求和运算,得出所述第二相似度。
本发明的实施例还提供了一种兴趣点POI数据的处理装置,包括:
第一获取模块,用于根据新增POI的坐标生成缓冲区,并将所述缓冲区和差分基准库进行叠加,获取所述缓冲区内所有的基准库POI;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京四维图新科技股份有限公司,未经北京四维图新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410749154.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:变齿变速链/齿轮
- 下一篇:一人次型软指套血氧饱和度探头
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置