[发明专利]一种POI信息差分方法和装置在审
申请号: | 201310125396.8 | 申请日: | 2013-04-11 |
公开(公告)号: | CN104102667A | 公开(公告)日: | 2014-10-15 |
发明(设计)人: | 罗丽俊 | 申请(专利权)人: | 北京四维图新科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;安利霞 |
地址: | 100028 北京市朝阳区曙*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 poi 息差 方法 装置 | ||
技术领域
本发明涉及POI差分领域,特别是涉及一种POI信息差分方法和装置。
背景技术
在现阶段作业员对第三方POI(Point of Interest,兴趣点)库进行差分,主要是提取POI名称与POI地址的主体词,对电话进行格式化,之后利用名称与地址的主体词,以及电话、类型、坐标这些信息,去原始库中查找相关信息;在查询的结果中寻找相似度高的POI作为匹配的结果;其中相似度主要依赖名称的主体与地址的主体相似度计算;计算的方法主要采用编辑距离、Jaccard相似性系数等方法。现有的这种差分方法,每天每人只能差分出100-200条POI,随着第三方POI信息急剧增多,传统的差分方法已经严重的影响地理信息数据的生产。
现有的POI差分的方法中通常情况下都是通过人为的建立第三方POI库与原始库类别对照关系或者人为对第三方POI库进行类别标注,来解决第三方POI库与原始库类别不统一带来的误差,但是这种方式非常笼统,有一定误差,不利于缩小匹配范围;同时POI坐标主要来自第三方POI库,但是通常第三方库的坐标都有一定偏差,而且大多数第三方POI库中都不包含坐标,同样不利于缩小匹配范围;在相似度的计算方法上,主要依赖地址与名称拆分后的主体相似度,这种方法用于计算地址的相似度并不准确,因为地址是分地理级别,在不同区会出现主体重名现象,而且不同地址才分后的地址级别权重应该是变化的;同时只靠名称主体、地址主体、类别与坐标去缩小匹配的范围会照成部分匹配数据的遗漏。
总之,现有的POI差分系统匹配率低,耗费时间长,增加了后续操作的难度。
发明内容
本发明的目的是提供一种POI信息差分方法和装置,提高了POI差分匹配率,减少了耗费时间。
为了解决上述技术问题,本发明提供了一种POI信息差分方法,包括如下步骤:
将待差分POI信息拆解成多个第一特征词;
将多个第一特征词进行组合,并通过搜索引擎查询获取POI集合;
计算POI集合中每个POI信息与待差分POI信息之间的第一相似度;
根据所述第一相似度来选择一个或者多个POI信息作为待差分POI信息的差分结果。
优选地,所述计算POI集合中每个POI信息与待差分POI信息之间的第一相似度,进一步包括:
为POI信息中的各个第二特征词分别分配一权重;
计算各个第二特征词与已有POI查询库的第二相似度;
将POI信息中各个第二特征词分配的权重和其对应的第二相似度的乘积进行求和运算,得到运算结果;
将该运算结果作为所述POI信息与待差分POI信息之间的第一相似度。
优选地,所述POI信息的第二特征词为名称、地址、电话、类别中的一种或者多种;
当第二特征词为名称时,该名称与已有POI查询库的第二相似度为:该名称与已有POI查询库的匹配结果;
当第二特征词为地址时,该地址与已有POI查询库的第二相似度为:将该地址根据级别划分为多个子地址,为每个子地址分配一权重,将每个子地址同已有POI查询库进行匹配来获取子相似度,并将每个子地址的权重与对应匹配的子相似度的乘积进行求和运算,得到的结果;
当第二特征词为电话时,该电话与已有POI查询库的第二相似度为:该电话与已有POI查询库的匹配结果;
当第二特征词为类别时,该类别与已有POI查询库的第二相似度为:该类别与已有POI查询库的匹配结果。
优选地,采用如下公式进行计算该地址的第二相似度scoreaddr:
其中n为地址划分的级别总数;levelk为不同级别的子地址匹配的子相似度;αk为子地址对应级别的权重,且
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京四维图新科技股份有限公司,未经北京四维图新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310125396.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于存储结构的遥测数据处理方法
- 下一篇:基于无参数量子论的图像检索方法