[发明专利]一种地址提取方法和装置在审
申请号: | 201910068517.7 | 申请日: | 2019-01-24 |
公开(公告)号: | CN111475742A | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 张仲良;刘军攀 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06Q10/08 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;李阳 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 地址 提取 方法 装置 | ||
本发明公开了一种地址提取方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:输入地址信息至行政区树模型,得到地址信息中的行政区地址要素;确定地址信息去除行政区地址要素后的剩余地址信息,输入剩余地址信息至有限状态机模型,得到剩余地址信息中的社区地址要素;根据地址要素的设定等级,按序组合行政区地址要素以及社区地址要素,生成与地址信息相应的精简地址。该实施方式针对现有地址库匹配的缺点,利用“精简地址处理工具”处理,使得多条对同一地理位置描述的信息经处理后都会对应于同一条标准的精简地址,这样即使新地址未在地址库中记录过,也可以根据所提取的精简地址进行相应站点的匹配查找,提高地址的匹配成功率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种地址提取方法和装置。
背景技术
随着物流行业的快速发展,订单业务量的不断增加。订单下传后需要根据地址匹配到正确的配送站点,从而完成配送。
现有主要是基于全地址(即用户下单时,所填写的详细地址)匹配配送站点的方式,即新地址通过一定匹配方式(例如关键字、GIS、人工分拣等)匹配到站点,待投递成功后将该地址以及配送站点写入地址库中。当下次完全相同的地址再次匹配时,会直接在地址库中找到该配送站点。
在实现本发明的过程中,发明人发现现有技术至少存在如下问题:
1)地址噪声未处理:订单中的地址通常为人工填写,对于相同的地址也可能存在描述上的不同,单纯地址库匹配失败的概率较大;
2)匹配较难:只能根据地址库,对已经妥投过得全地址进行匹配,而对于新的地址无法相似匹配,例如“A市B区C广场D座5层5001室”,对应的配送站点为C站;但对于新地址“A市B区C广场D座2101时”,虽然都描述的是一栋楼,但地址不完全相同,无法根据新地址在地址库中查找到对应的站点;
3)依赖人工:当地址库匹配失败后,通常需要依赖人工进行匹配。
发明内容
有鉴于此,本发明实施例提供一种地址提取方法和装置,至少能够解决现有技术中依据全地址匹配失败率较高的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种地址提取方法,包括:
输入地址信息至行政区树模型,得到所述地址信息中的行政区地址要素;
确定所述地址信息去除所述行政区地址要素后的剩余地址信息,输入所述剩余地址信息至有限状态机模型,得到所述剩余地址信息中的社区地址要素;
根据地址要素的设定等级,按序组合所述行政区地址要素以及所述社区地址要素,生成与所述地址信息相应的精简地址。
可选的,在所述输入地址信息至行政区树模型之前,还包括:
提取所述地址信息中的噪声信息,根据预定去噪方式,对所述噪声信息进行噪声预处理。
可选的,在所述生成与所述地址信息相应的精简地址之后,还包括:
获取与所述地址信息相应的配送站点,以确定所述精简地址与所述配送站点之间的对应关系;以及
根据所述行政区树模型和所述有限状态机模型,提取待处理地址信息中的地址要素,按序组合所提取的地址要素生成待处理精简地址;
根据精简地址与配送站点之间的对应关系,确定与所述待处理精简地址相应的配送站点。
可选的,还包括:当监测到对所述地址信息的变更操作时,根据所述行政区树模型和所述有限状态机模型,提取变更后地址信息中的地址要素,按序组合所提取的地址要素生成变更后的精简地址。
为实现上述目的,根据本发明实施例的另一方面,提供了一种地址提取装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910068517.7/2.html,转载请声明来源钻瓜专利网。