[发明专利]一种地址标准化处理系统及方法在审
申请号: | 202111392662.4 | 申请日: | 2021-11-23 |
公开(公告)号: | CN114065698A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 刘臻 | 申请(专利权)人: | 上海歆广数据科技有限公司 |
主分类号: | G06F40/103 | 分类号: | G06F40/103;G06F16/903 |
代理公司: | 上海谱璟专利代理事务所(普通合伙) 31422 | 代理人: | 吕琳琳 |
地址: | 200082 上海市杨浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 地址 标准化 处理 系统 方法 | ||
本发明地址标准化处理系统及方法:获取与某区域相关的所有原地址数据;将原地址数据中满足相应地址规则的地址数据进行汇聚;基于地址规则中含有的某地址数据匹配标准地址,匹配成功且匹配出标准地址为唯一一个时则经人工审核通过时将该地址数据和该标准地址映射、在匹配出的标准地址为多个时则经人工审核基于该多个标准地址最终确定一个标准地址并映射,经人工审核未通过时进行人工手动定位以校验出该地址数据相映射的标准地址,在匹配失败时通知人工手动定位;将该地址数据相映射的标准地址回传给该地址数据下各原地址数据,提取各原地址数据中该地址数据后紧跟详细地址数据来补充至对应标准地址后面以得各原地址数据对应详细标准地址。
技术领域
本发明涉及地址标准化技术领域,特别是涉及一种地址标准化处理系统及方法。
背景技术
现有各个系统中同样地点的地址写法五花八门,使得地址看起来比较杂乱,若是逐个处理非标地址需要投入大量的人力,导致成本高昂,而且人力处理这么大的地址数据,容易导致出错,而且地址标准化的工作需要反复不断地进行,没有积累,长期成本巨大。
现有自动对非标地址进行标准化处理的手段,由于其准确率始终在50-70%之间徘徊,因此不能用来支持海量地址数据的全面自动化处理。而一旦需要人力介入干预,其数据的导入导出、对接、以及处理过程的积累,都变得非常繁琐并且消耗人力。因此,需要一种既能充分利用自动非标地址处理手段,又可以有效结合人工判断,同时可以大幅节约人力的重复劳动,降低处理成本的系统。
发明内容
本发明针对现有技术存在的问题和不足,提供一种地址标准化处理系统及方法。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供一种地址标准化处理系统,其特点在于,其包括地址获取模块、地址汇聚模块、地址校验模块和地址回传模块;
所述地址获取模块用于从源数据库中获取与某一区域相关的所有原地址数据,以便对该区域的地址进行地址标准化;
所述地址汇聚模块用于对该区域的所有原地址数据进行识别,利用规则管理器中预设的地址规则,将识别出的原地址数据中满足相应地址规则的地址数据进行汇聚以减少数据处理量、不满足任一地址规则的地址数据单独呈现,每个地址规则含有的地址数据下均存有汇聚后的对应地址数据;
所述地址校验模块用于基于地址规则中含有的某一地址数据匹配标准地址集中相对应的标准地址,在匹配成功时校验匹配出的标准地址是否正确,在匹配出的标准地址为唯一一个时则经人工审核通过时将该地址数据和该标准地址映射上、经人工审核未通过时进行人工手动定位校验以校验出该地址数据相映射的标准地址,在匹配出的标准地址为多个时则经人工审核基于该多个标准地址最终确定一个标准地址并将该地址数据和最终确定的标准地址映射上、经人工审核均未通过时进行人工手动定位校验以校验出该地址数据相映射的标准地址,在匹配失败时通知人工手动定位校验以校验出该地址数据相映射的标准地址;
所述地址回传模块用于将该地址数据相映射的标准地址回传给该地址数据下各个原地址数据,并提取各个原地址数据中该地址数据后紧跟的详细地址数据来补充至对应的标准地址后面以获得各个原地址数据对应的详细标准地址,详细标准地址由映射出的标准地址和补充的地址构成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海歆广数据科技有限公司,未经上海歆广数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111392662.4/2.html,转载请声明来源钻瓜专利网。