[发明专利]地址库索引方法、地址匹配方法以及相关设备在审
申请号: | 202110134495.7 | 申请日: | 2021-01-29 |
公开(公告)号: | CN112835899A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 于首杰 | 申请(专利权)人: | 上海寻梦信息技术有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2457;G06F16/29;G06F40/289;G06Q10/08 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 潘一诺 |
地址: | 200050 上海市长宁*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 索引 方法 匹配 以及 相关 设备 | ||
本发明提供一种地址库索引方法、地址匹配方法以及相关设备,地址库索引方法,包括:将所述地址库按所述地址库中各地址信息的至少部分区域信息划分为多个查询分片;对所述地址库中的每一地址信息执行地址索引生成步骤,所述地址索引生成步骤包括:对该地址信息进行分词,获得多个分词结果;合并该地址信息的多个分词结果,以获得第一字段;将所述第一字段作为该地址信息的地址索引,以供根据所述地址索引搜索获得该地址信息。本发明在海量标准地址的地址库中,在保证准确性的情况下,能够尽可能少的时间找到最优匹配的地址。
技术领域
本发明涉及计算机应用领域,尤其涉及一种地址库索引方法、地址匹配方法以及相关设备。
背景技术
目前,在各类物流场景中,在用户给定收货地址后,需要快速得到该地址对应的经纬度。而这个过程需要从地址数量达到亿级的标准地址库中,寻找最优匹配的地址,进而得到对应的经纬度。
无论是物流平台的服务器还是电商平台的服务器,在海量订单的场景下,上述地址匹配的过程不仅需要效果优异、准确率较高,同时要求较高的匹配效率,否则,将可能出现订单数据堆积、队列堵塞等情况,影响物流订单的正常进行。
由此,如何在海量标准地址的地址库中,在保证准确性的情况下,以尽可能少的时间找到最优匹配的地址,是本领域亟待解决的技术问题。
发明内容
本发明为了克服上述相关技术存在的缺陷,提供一种地址库索引方法、地址匹配方法以及相关设备,进而在海量标准地址的地址库中,在保证准确性的情况下,能够尽可能少的时间找到最优匹配的地址。
根据本发明的一个方面,提供一种地址库索引方法,包括:
将所述地址库按所述地址库中各地址信息的至少部分区域信息划分为多个查询分片;
对所述地址库中的每一地址信息执行地址索引生成步骤,所述地址索引生成步骤包括:
对该地址信息进行分词,获得多个分词结果;
合并该地址信息的多个分词结果,以获得第一字段;
将所述第一字段作为该地址信息的地址索引,以供根据所述地址索引搜索获得该地址信息。
在本发明的一些实施例中,所述合并该地址信息的多个分词结果,以获得第一字段包括:
根据上下文无关文法,合并该地址信息的多个分词结果,以获得第一字段。
在本发明的一些实施例中,所述对该地址信息进行分词,获得多个分词结果包括:
采用地址词库对该地址信息按多个分词算法分别进行分词,获得多个分词结果。
在本发明的一些实施例中,所述分词算法包括:最大匹配分词算法、最小匹配分词算法、索引分词算法或者它们之间的任意组合。
在本发明的一些实施例中,所述地址索引生成步骤还包括:
对该地址信息进行解析以获得至少一个第一预定字段;
将所述第一预定字段作为该地址信息的辅助索引字段。
在本发明的一些实施例中,所述对该地址信息进行解析以获得至少一个第一预定字段包括:
采用一个序列标注算法或者采用多个序列标注算法的组合,对该地址信息进行解析以获得至少一个第一预定字段。
在本发明的一些实施例中,所述第一预定字段包括乡、镇、村、社区、兴趣点、路名、路号、楼栋号中的一项或多项。
在本发明的一些实施例中,所述地址库索引方法基于分布式搜索服务器实现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寻梦信息技术有限公司,未经上海寻梦信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110134495.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电主轴前轴承结构和电主轴
- 下一篇:一种互联网支付安防自动拒止系统