[发明专利]地址匹配方法及装置有效
申请号: | 202010450289.2 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111625732B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 张瑞飞;郭孟振;单培 | 申请(专利权)人: | 鼎富智能科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/29;G06F40/289 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 230000 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 匹配 方法 装置 | ||
本申请提供了一种地址匹配方法及装置。所述方法包括:采用预设的地址识别模型,识别出待匹配地址对应的待匹配地址分词,以及每个待匹配地址分词对应的地址等级,根据预设的关键地址等级,从多个待匹配地址分词中确定出关键地址分词,进而可以从预设标准地址库中确定出与关键地址分词相匹配的候选地址,并将与待匹配地址相似度最高的候选地址,确定为目标地址。由于候选地址是根据关键地址分词筛选出的,而关键地址分词又是根据标准地址中关键信息对应的地址等级确定的,因此,可以保证关键地址分词是待匹配地址中的关键信息,进而可以缩小候选地址与待匹配地址之间的差距,提高地址匹配技术的匹配准确度。
技术领域
本申请涉及数据处理技术领域,特别涉及一种地址匹配方法及装置。
背景技术
古往今来,几乎人类所有活动都是发生在地球上,都与地球表面位置(即地理空间位置)息息相关,随着计算机技术的日益发展和普及,地理信息系统(GeographyInformation System,GIS)以及在此基础上发展起来的“数字地球”、“数字城市”在人们的生产和生活中起着越来越重要的作用。
GIS系统的建立,需要大量的地理空间位置数据支撑。但现有的地址数据库中保存这大量与地理空间位置相关的非空间数据(即自然语言描述的地址信息),这些非空间数据不能准确地转换为空间数据(即空间的地理位置坐标),进而也无法为GIS系统的建立提供支撑。
现有技术通常采用地址匹配技术解决上述问题,即建立自然语言描述的地址信息与其空间的地理位置坐标之间的对应关系。具体实现时,首先要将自然语言描述的地址信息匹配到标准地址,然后再根据标准地址的地理位置坐标,确定自然语言描述的地址信息的地理位置坐标。这一过程的难点在于自然语言描述的地址信息与标准地址之间的匹配准确度,目前常用的方案是相似度计算,即计算待匹配地址与标准地址之间的相似度值,相似度值越高,越匹配。但是,在一个城市中常有相近的道路名称(如南京东路和南京西路)、相近的建筑名称(如万达广场和万科广场)或相近的小区名称(如鼓楼一村和鼓楼新村),这就容易导致相似度值较高的两个地址,实际上是相距甚远的两个地方,进而影响地址匹配技术的匹配准确度。
基于此,目前亟需一种地址匹配方法,用于解决现有技术中基于相似度计算的地址匹配技术,容易导致相似度值较高的两个地址,实际上是相距甚远的两个地方,进而影响地址匹配技术的匹配准确度的问题。
发明内容
本申请提供了一种地址匹配方法及装置,可用于解决在现有技术中基于相似度计算的地址匹配技术,容易导致相似度值较高的两个地址,实际上是相距甚远的两个地方,进而影响地址匹配技术的匹配准确度的技术问题。
第一方面,本申请实施例提供一种地址匹配方法,所述方法包括:
获取待匹配地址;
采用预设的地址识别模型,从所述待匹配地址中识别出多个待匹配地址分词以及每个待匹配地址分词对应的地址等级;所述预设的地址识别模型是根据样本地址、样本地址分词以及样本地址分词对应的地址等级对初始的地址识别模型进行训练后得到的;
根据预设的关键地址等级与所述每个待匹配地址分词对应的地址等级,从所述多个待匹配地址分词中确定出与所述预设的关键地址等级相匹配的关键地址分词;所述预设的关键地址等级是根据标准地址中关键信息对应的地址等级确定的;
从预设标准地址库中确定出与所述关键地址分词相匹配的候选地址;所述预设标准地址库中存储有多个标准地址;
将与所述待匹配地址相似度最高的候选地址,确定为目标地址。
结合第一方面,在第一方面的一种可实现方式中,从预设标准地址库中确定出与所述关键地址分词相匹配的候选地址,包括:
以所述关键地址分词为索引,从所述预设标准地址库中搜索得到初始候选地址;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鼎富智能科技有限公司,未经鼎富智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010450289.2/2.html,转载请声明来源钻瓜专利网。