[发明专利]地址的标准化方法、装置、存储介质及处理器有效
申请号: | 201811083773.5 | 申请日: | 2018-09-17 |
公开(公告)号: | CN110909110B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 谢朋峻;郑华飞;刘楚;李林琳;司罗 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 褚敏;宋子良 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 标准化 方法 装置 存储 介质 处理器 | ||
1.一种地址的标准化方法,其特征在于,包括:
获取多个地址数据;
将所述多个地址数据中的每个地址数据划分为多个地址要素;
从所述多个地址要素中确定待索引地址要素,并从所述多个地址数据中获取包含所述待索引地址要素的地址数据;
对所述包含所述待索引地址要素的地址数据中除所述待索引地址要素之外的其余地址要素中位于预设标准化地址结构的同一层级的多个备选地址要素进行可信度评估,并根据评估结果生成待使用的标准化地址。
2.根据权利要求1所述的方法,其特征在于,将所述多个地址数据中的每个地址数据划分为多个地址要素包括:
按照预设标准化地址结构统一将所述多个地址数据中的每个地址数据划分为所述多个地址要素;
根据每个地址要素位于所述预设标准化地址结构的层级添加对应的标识。
3.根据权利要求1所述的方法,其特征在于,从所述多个地址要素中确定所述待索引地址要素,并从所述多个地址数据中获取所述包含所述待索引地址要素的地址数据包括:
从所述多个地址要素中随机选取所述待索引地址要素;
为所述待索引地址要素构建索引,并通过所述索引从所述多个地址数据中查找所述包含所述待索引地址要素的地址数据。
4.根据权利要求2所述的方法,其特征在于,对所述包含所述待索引地址要素的地址数据中除所述待索引地址要素之外的其余地址要素中位于预设标准化地址结构的同一层级的多个备选地址要素进行可信度评估,并根据所述评估结果生成所述待使用的标准化地址包括:
对所述其余地址要素中位于所述预设标准化地址结构的同一层级的多个备选地址要素进行可信度评分,并根据可信度评分结果从所述多个备选地址要素中确定待使用的地址要素;
将确定出的各个待使用的地址要素进行合并,生成所述待使用的标准化地址。
5.根据权利要求4所述的方法,其特征在于,根据所述可信度评分结果从所述多个备选地址要素中确定所述待使用的地址要素包括:
将所述多个备选地址要素中可信度评分最高的备选地址要素确定为所述待使用的地址要素。
6.根据权利要求4所述的方法,其特征在于,根据所述可信度评分结果从所述多个备选地址要素中确定所述待使用的地址要素包括:
将所述多个备选地址要素中选取可信度评分超过预设阈值的备选地址要素确定为所述待使用的地址要素,并且当超过所述预设阈值的备选地址要素的数量多于一个时,则将超过所述预设阈值的备选地址要素中可信度评分最高的备选地址要素确定为所述待使用的地址要素,其中,所述预设阈值是预估的经验值或者通过模型训练得到的参考值。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述方法用于导航地图中的地址标注。
8.根据权利要求1-6中任一项所述的方法,其特征在于,所述方法用于公安领域的地址标注。
9.根据权利要求4-6中任一项所述的方法,其特征在于,采用投票机制完成所述可信度评分。
10.一种地址的标准化装置,其特征在于,包括:
获取单元,用于获取多个地址数据;
划分单元,用于将所述多个地址数据中的每个地址数据划分为多个地址要素;
确定单元,用于从所述多个地址要素中确定待索引地址要素,并从所述多个地址数据中获取包含所述待索引地址要素的地址数据;
评估单元,用于对所述包含所述待索引地址要素的地址数据中除所述待索引地址要素之外的其余地址要素中位于预设标准化地址结构的同一层级的多个备选地址要素进行可信度评估,并根据评估结果生成待使用的标准化地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811083773.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:短信的分类方法及装置
- 下一篇:上行语音业务的传输方法、装置、设备和存储介质