[发明专利]一种客户标准地址数据库的更新方法及系统在审
申请号: | 202211259838.3 | 申请日: | 2022-10-14 |
公开(公告)号: | CN115438061A | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 邰伟鹏;卞义;李伟;陈业斌 | 申请(专利权)人: | 安徽工业大学科技园有限公司 |
主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/29;G06F16/903 |
代理公司: | 南京九致知识产权代理事务所(普通合伙) 32307 | 代理人: | 严巧巧 |
地址: | 243000 安徽省马鞍山市经*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 客户 标准 地址 数据库 更新 方法 系统 | ||
本发明公开了一种客户标准地址数据库的更新方法及系统。包括:对文本信息拆分得到区域地址数组及详情地址数组;拼接区域地址数组及部分详情地址数组获得第一拼接地址,基于第三方地址标准化API对其补充得到第一补全地址及相应的经纬度数据;基于Trie树结构将区域地址数组匹配至分词匹配表内,并对其补充得到补充区域地址数组;拼接补充区域地址数组及部分详情地址数组获得第二拼接地址,并基于第三方地址标准化API对其补充得到第二补全地址及经纬度数据;对比第一补全地址及第二补全地址各地址层级匹配权重和,基于较优权重和对应的补全地址对标准地址数据库更新。本发明基于文本类,特别是异地输入的文本类原始地址实现了标准地址数据库更新。
技术领域
本发明涉及数据处理技术领域,具体涉及一种客户标准地址数据库的更新方法及系统。
背景技术
在物流配送及汽车导航等各种涉及地址使用的服务行业中,标准地址数据库内的数据充盈度及各地址的标准度与服务效率及服务质量息息相关。因此,需要不断将新地址存入所述标准地址数据库内,并在将新地址存入所述标准地址数据库前对相应的新地址进行标准化处理。
现有技术中,对于新地址的标准化处理,多通过如下步骤进行:首先,基于用户的当前定位请求获取相应的地址参数;然后,基于第三方地址编码API在本地ES库内筛选与所述地址参数相似的若干个地址节点;最终,将所述地址参数与各地址节点分别对比并选取偏移量最小的作为与用户的当前定位请求相应的标准地址,并将其存入标准地址数据库内。
但该方法仅适用于新地址来源于用户定位请求的地址标准化情况。而在实际使用时,新地址多表现为用户输入的多种多样的文本信息形式,同时受用户输入过程影响,这些文本信息与基于定位请求获取的地址参数相比存在更多的形式缺陷,进而导致现有技术中基于定位请求的标准化方法无法在该类情况下有效应用,特别是,当与新地址相应的文本信息为用户异地输入的时候。
发明内容
本发明目的在于提供一种客户标准地址数据库的更新方法及系统,用于解决无法对文本类原始地址,特别是异地输入的文本类原始地址进行标准化处理,并基于其实现标准地址数据库更新的技术问题。
为达成上述目的,本发明提出如下技术方案:
一种客户标准地址数据库的更新方法,包括:
获取与原始地址对应的文本信息,并基于配置表对所述文本信息进行拆分以得到相应的区域地址数组及详情地址数组;其中,所述区域地址数组由高至低依次包括:省级地址、市级地址、县级地址、镇级地址及社区级地址;所述详情地址数组由高至低依次包括:楼栋地址及门牌地址;
拼接所述区域地址数组中的所有地址层级及所述详情地址数组中的最高地址层级以获得第一拼接地址,并基于第三方地址标准化API对所述第一拼接地址进行补充以得到第一补全地址,及与所述第一补全地址相应的经纬度数据;
基于Trie树结构将所述区域地址数组匹配至分词匹配表内,并取相应子节点中的关联地址对所述区域地址数组进行补充以得到补充区域地址数组;
拼接所述补充区域地址数组中的所有地址层级及所述详情地址数组中的最高地址层级以获得第二拼接地址,并基于第三方地址标准化API对所述第二拼接地址进行补充以得到第二补全地址,及与所述第二补全地址相应的经纬度数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽工业大学科技园有限公司,未经安徽工业大学科技园有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211259838.3/2.html,转载请声明来源钻瓜专利网。