[发明专利]地址定位、地址监测、信息处理方法及装置有效
申请号: | 201710557719.9 | 申请日: | 2017-07-10 |
公开(公告)号: | CN109241208B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 刘永凯 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 定位 监测 信息处理 方法 装置 | ||
本申请实施例提供了一种地址定位、地址监测、信息处理方法及装置,涉及定位搜索技术领域。所述地址定位方法包括:从目标地址中提取多个字符组合,确定所述多个字符组合作为地址元素的元素属性,根据字符组合的元素属性将所述目标地址分解为多个地址元素,基于所述多个地址元素进行地址定位。本申请能够提高地址定位的准确性和可靠性。
技术领域
本申请涉及定位搜索技术领域,特别是涉及一种地址定位、地址监测、信息处理方法及装置。
背景技术
随着路线导航、物流配送等行业的迅猛发展,定位搜索技术的应用也越来越广泛。为了便于路线导航和物流配送,以及基于用户的所处的地址坐标进行其它的数据分析和应用,通常需要将海量用户填写的、个性化的各种文字地址描述转换为用经度和纬度描述的具体地址坐标,因此,需要一种地址定位方法。
现有技术中,可以接收用户提交的目标地址,通过剔除噪音、更改格式和纠正拼写等方式对该目标地址进行规范化处理,通过调用地址元素词典数据库,将规划处处理后的目标地址分解为多个地址元素,查找与该多个地址元素对应的地址坐标,从而完成地址定位。
由于需要通过调用地址元素词典数据库才能完成地址定位,该地址元素词典数据库通常是通过人工收集得到的。一方面,由于用户提交的目标地址可能千变万化,而不同的经度和纬度也可以有无限种组合,另一方面,通过人工收集得到这两个数据库的效率也相当有限。因此,该地址元素词典数据库所收集的地址元素的数目通常有限,这会导致可能无法对某些目标地址进行分解,进而导致无法对某些目标地址定位,地址定位的可靠性低下。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的地址定位、地址监测、信息处理方法及装置。
根据本申请的一个方面,提供了一种地址定位方法,包括:
从目标地址中提取多个字符组合;
确定所述多个字符组合作为地址元素的元素属性;
根据字符组合的元素属性将所述目标地址分解为多个地址元素;
基于所述多个地址元素进行地址定位。
可选的,所述元素属性包括组合概率,所述确定所述多个字符组合作为地址元素的元素属性包括:
将所述字符组合与所述目标地址内相邻于所述字符组合的至少一个其它字符组成父字符组合;
确定所述字符组合在地址集合中的第一统计数据和各父字符组合在所述地址集合中的第二统计数据;
根据所述第一统计数据和第二统计数据,确定所述字符组合的组合概率,所述组合概率与所述第一统计数据成负向关系,且与所述第二统计数据成正向关系。
可选的,所述根据字符组合的元素属性将所述目标地址分解为多个地址元素包括:
如果所述组合概率处于预设组合概率范围,则以所述字符组合为地址元素对所述目标地址进行拆分。
可选的,所述元素属性包括分解概率,所述确定所述多个字符组合作为地址元素的元素属性包括:
将所述字符组合的子字符组合与至少一个其它字符组成父字符组合;
确定所述字符组合在地址集合中的第一统计数据和除所述字符组合外的各父字符组合在地址集合中的第三统计数据;
根据所述第一统计数据和所述第三统计数据,确定所述字符组合的分解概率,所述分解概率与所述第一统计数据成负向关系。
可选的,所述根据字符组合的元素属性将所述目标地址分解为多个地址元素包括:
如果所述分解概率处于预设分解概率范围,则以所述字符组合为地址元素对所述目标地址进行拆分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710557719.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种路线查询方法及装置
- 下一篇:一种区域农业规划空间数据的通用建库方法