[发明专利]一种地址数据处理方法及其装置在审
申请号: | 201811378806.9 | 申请日: | 2018-11-19 |
公开(公告)号: | CN111198912A | 公开(公告)日: | 2020-05-26 |
发明(设计)人: | 郑华飞;谢朋峻;李林琳;司罗 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/29 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 地址 数据处理 方法 及其 装置 | ||
1.一种地址数据处理方法,其特征在于,包括:
将多个数据源的地址数据转换为结构化地址数据;
将结构化地址数据按照标准模式转换为标准地址数据,其中,标准模式包括构成标准地址数据的各个字段以及各个字段对应的数据类型。
2.如权利要求1所述的方法,其特征在于,将多个数据源的地址数据转换为结构化地址数据包括:
通过对多个数据源的地址数据执行命名实体识别,将多个数据源的地址数据转换为结构化地址数据。
3.如权利要求1所述的方法,其特征在于,在将结构化地址数据按照标准模式转换为标准地址数据后还包括:
确定接收的地址数据与标准地址数据是否是同一地址的数据;
若是,则利用所述地址数据对标准地址数据中的字段进行补充。
4.如权利要求3所述的方法,其特征在于,利用所述地址数据对标准地址数据中的字段进行补充包括:
将所述地址数据转换为结构化地址数据;
利用所述结构化地址数据对标准地址数据中的空缺字段进行补充。
5.如权利要求3所述的方法,其特征在于,还包括:
若接收的地址数据与标准地址数据不是同一地址的数据,则将接收的地址数据转换为标准地址数据。
6.如权利要求1所述的方法,其特征在于,生成标准格式的结构化地址数据作为标准地址数据后还包括:
利用标准地址数据生成地址数据库。
7.如权利要求6所述的方法,其特征在于,在利用标准地址数据生成地址数据库后还包括:
接收来自用户的地址请求;
通过对地址请求中包含的地址信息进行结构化解析,获取与所述地址信息对应的结构化地址数据;
利用所述结构化地址数据搜索地址数据库,确定标准地址数据。
8.如权利要求7所述的方法,其特征在于,利用结构化地址数据搜索地址数据库确定标准地址数据包括:
利用结构化地址数据中包含的字段所构成的多种字段组合对地址数据库进行检索,获取与所述多种字段组合对应的多个标准地址数据。
9.如权利要求8所述的方法,其特征在于,获取与所述多种字段组合对应的标准地址数据后包括:
根据与所述多个标准地址数据分别对应的检索分数,对所述多个标准地址数据进行排序,其中,所述检索分数是通过每个字段组合的权重值以及字段组合中的每个字段的权重值确定的。
10.如权利要求1所述的方法,其特征在于,在将多个数据源的地址数据转换为结构化地址数据前还包括:
获取多个数据源的地址数据;
对所述多个数据源的地址数据根据数据源进行数据有效性筛选。
11.如权利要求1所述的方法,其特征在于,所述多个数据源的地址数据包括来自各种应用对应的服务器的地址数据、来自各种网站对应的服务器的地址数据以及上门采集的地址数据。
12.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被执行时实现权利要求1至11中的任一权利要求所述的方法。
13.一种地址数据处理方法,其特征在于,包括:
接收来自用户的地址请求;
通过根据从地址请求获取的地址数据搜索地址数据库,获取与所述地址数据对应的标准地址数据,其中,所述地址数据库包括按照标准模式生成的多个标准地址数据。
14.如权利要求13所述的方法,其特征在于,通过根据从地址请求获取的地址数据搜索地址数据库,获取与所述地址数据对应的标准地址数据包括:
通过对地址请求中包含的地址信息进行结构化解析,获取与所述地址信息对应的结构化地址数据;
利用所述结构化地址数据搜索地址数据库,获取与所述地址数据对应的标准地址数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811378806.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本数据处理方法及其装置
- 下一篇:半导体器件及半导体器件制备方法