[发明专利]地址数据的匹配方法、装置、计算机设备及存储介质在审

专利信息
申请号: 202011195424.X 申请日: 2020-10-30
公开(公告)号: CN112307169A 公开(公告)日: 2021-02-02
发明(设计)人: 徐耀宗;罗冬阳;魏晨晨 申请(专利权)人: 中国平安财产保险股份有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/31
代理公司: 深圳众鼎专利商标代理事务所(普通合伙) 44325 代理人: 谭果林
地址: 518000 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 地址 数据 匹配 方法 装置 计算机 设备 存储 介质
【说明书】:

发明公开了一种地址数据的匹配方法、装置、计算机设备及存储介质。所述方法包括:通过单词查找树解析出用户地址数据的待比对关键区域信息,根据待比对关键区域信息从用户地址数据分割出待比对模糊区域信息;根据预设的倒排索引检索结构对待比对模糊区域信息进行倒排索引检索,获取与用户地址数据之间的匹配值满足预设匹配条件的预设候选标准地址;将用户地址数据的待比对关键区域信息与获取的预设候选标准地址的预设关键区域信息进行对比矫正,获取矫正结果;根据矫正成功的矫正结果确定出与用户地址数据匹配的标准匹配地址,并将标准匹配地址代替用户登记的用户地址数据。通过本发明可快速匹配出准确且与用户地址数据对应的标准匹配地址。

技术领域

本发明涉及数据查询领域,尤其涉及一种地址数据的匹配方法、装置、计算机设备及存储介质。

背景技术

目前,在数据处理过程经常会碰到一些非数值型的文本数据,且该部分文本数据往往包含了一些很有价值的数据,如何从这些文本数据确定出有价值的数据就显得更为重要。现有技术中,会采用关键词匹配的方式提取有价值的数据,但在提取之前,需预先进行标注工作,如,在对客户地址进行标注时,需人工标注客户地址,但由于用户填写的地址可能模糊不完整,如同一个小区可能出现在多个城市,此外,用户填写可能存在错别字等,上述情况均会导致在根据地理关键词匹配客户所居住的客户地址的过程中产生匹配错误和数据遗漏的问题,而人工标注的工作会非常繁琐,耗时且耗成本,且上述现有技术关键词匹配的方式,关键词需查找一个最匹配的关键词进行匹配,花费匹配时间会较长,关键词标注错误以及上述标注工作的问题都会影响到准确率,因此现有技术很难保证有效且快速获取用户较为准确的客户地址。

发明内容

基于此,有必要针对上述技术问题,提供一种地址数据的匹配方法、装置、计算机设备及存储介质,用于解决上述问题。

一种地址数据的匹配方法,包括:

获取用户登记的用户地址数据;

通过单词查找树解析出所述用户地址数据的待比对关键区域信息,同时根据所述待比对关键区域信息从所述用户地址数据分割出待比对模糊区域信息;

根据预设的倒排索引检索结构对所述待比对模糊区域信息进行倒排索引检索,获取与所述用户地址数据之间的匹配值满足预设匹配条件的预设数量的预设候选标准地址;每一个所述预设标准地址均包括预设模糊区域信息和预设关键区域信息,所述倒排索引检索结构是根据多个所述预设候选标准地址的预设模糊区域信息所构建;

将所述用户地址数据的待比对关键区域信息与获取的预设数量的所述预设候选标准地址的预设关键区域信息进行对比矫正,获取矫正结果;

在所述矫正结果为矫正成功时,根据矫正成功的所述矫正结果确定出与所述用户地址数据匹配的标准匹配地址,并将所述标准匹配地址代替所述用户登记的用户地址数据。

一种地址数据的匹配装置,包括:

第一获取模块,用于获取用户登记的用户地址数据;

第一分割模块,用于通过单词查找树解析出所述用户地址数据的待比对关键区域信息,同时根据所述待比对关键区域信息从所述用户地址数据分割出待比对模糊区域信息;

第二获取模块,用于根据预设的倒排索引检索结构对所述待比对模糊区域信息进行倒排索引检索,获取与所述用户地址数据之间的匹配值满足预设匹配条件的预设数量的预设候选标准地址;每一个所述预设标准地址均包括预设模糊区域信息和预设关键区域信息,所述倒排索引检索结构是根据多个所述预设候选标准地址的预设模糊区域信息所构建;

第三获取模块,用于将所述用户地址数据的待比对关键区域信息与获取的预设数量的所述预设候选标准地址的预设关键区域信息进行对比矫正,获取矫正结果;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011195424.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top