[发明专利]地址处理方法及装置在审
申请号: | 202011323032.7 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112417179A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 宋焱;张芹 | 申请(专利权)人: | 杭州橙鹰数据技术有限公司 |
主分类号: | G06F16/387 | 分类号: | G06F16/387;G06F40/284 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 刘晓楠 |
地址: | 310000 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 处理 方法 装置 | ||
本说明书提供地址处理方法及装置,其中,地址处理方法包括:获取待处理地址,其中,所述待处理地址包括基础字段以及至少一个参考字段,所述基础字段为所述待处理地址指向的最小地域范围信息的字段,所述参考字段为所述待处理地址中除所述基础字段外的指向其他层级地域范围信息的字段;将所述基础字段以及至少一个参考字段与预先建立的地址树中至少两个层级的标准字段进行匹配,确定所述待处理地址对应的目标标准地址。上述方法不需要对待处理地址进行分词,只需将待处理地址中的字段与预先建立的地址树中的标准字段进行匹配,便可以得到待处理地址对应的目标标准地址,降低了地址处理的复杂程度,进而提高了地址处理的效率。
技术领域
本说明书涉及数据处理技术领域,特别涉及地址处理方法及装置。
背景技术
地址编码是一种可以将复杂多变的地址映射成计算机能识别的标准化编码的技术,在物流配送、定位导航等领域有广泛的应用。但现有的地址大多数是不规则的地址或者有层级缺失的地址,很难按照统一的规则进行地址编码,或者即使可以进行地址编码,生成的标准化编码可能是不准确的。因此,亟需一种可以对地址进行处理,以使得处理后的地址便于进行地址编码的方法。
现有技术中,可以预先建立分词词典、地址分级词典和常见地址缩略词替代词典三个预设词典,基于该预设词典对待处理地址进行处理,得到分词结果,将该分词结果与标准地址库进行匹配,将与该分词结果相似度最高的标准地址确定为对待处理地址处理后的处理地址。
但上述方法需要先对待处理地址进行分词,再进行相似度匹配,操作比较复杂,使得地址处理的效率较低。
发明内容
有鉴于此,本说明书实施例提供了一种地址处理方法。本说明书同时涉及一种地址处理装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种地址处理方法,包括:
获取待处理地址,其中,所述待处理地址包括基础字段以及至少一个参考字段,所述基础字段为所述待处理地址指向的最小地域范围信息的字段,所述参考字段为所述待处理地址中除所述基础字段外的指向其他层级地域范围信息的字段;
将所述基础字段以及至少一个参考字段与预先建立的地址树中至少两个层级的标准字段进行匹配,确定所述待处理地址对应的目标标准地址。
可选地,所述将所述基础字段以及至少一个参考字段与预先建立的地址树中至少两个层级的标准字段进行匹配,确定所述待处理地址对应的目标标准地址,包括:
将所述基础字段以及至少一个参考字段与预先建立的地址树中至少两个层级的标准字段进行匹配,确定所述基础字段对应的第一目标标准字段,以及所述至少一个参考字段对应的第二目标标准字段;
根据第一目标标准字段和至少一个所述第二目标标准字段,确定所述目标标准地址。
可选地,所述地址树中包括M个层级,且所述M为大于1的正整数,所述标准字段的长度为N,且所述N为大于0的正整数,所述将所述基础字段以及至少一个参考字段与预先建立的地址树中至少两个层级的标准字段进行匹配,包括:
将所述待处理地址中第一个字符的位置确定为待匹配字段的开始位置和结束位置;
将位于所述开始位置和所述结束位置之内的字符确定为所述待匹配字段;
将所述待匹配字段与所述地址树中第i层级的标准字段进行匹配,其中,所述i为大于0且小于或等于M的正整数;
若匹配成功,且所述待匹配字段中不包括所述基础字段的字符,将所述第i层级中与所述待匹配字段匹配的标准字段确定为所述待处理地址中所述目标参考字段对应的第二目标标准字段,其中,所述目标参考字段为所述至少一个参考字段中的任一参考字段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州橙鹰数据技术有限公司,未经杭州橙鹰数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011323032.7/2.html,转载请声明来源钻瓜专利网。