[发明专利]地址数据的匹配方法、装置、计算机设备及存储介质在审
申请号: | 202011195424.X | 申请日: | 2020-10-30 |
公开(公告)号: | CN112307169A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 徐耀宗;罗冬阳;魏晨晨 | 申请(专利权)人: | 中国平安财产保险股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/31 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 谭果林 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 数据 匹配 方法 装置 计算机 设备 存储 介质 | ||
1.一种地址数据的匹配方法,其特征在于,包括:
获取用户登记的用户地址数据;
通过单词查找树解析出所述用户地址数据的待比对关键区域信息,同时根据所述待比对关键区域信息从所述用户地址数据分割出待比对模糊区域信息;
根据预设的倒排索引检索结构对所述待比对模糊区域信息进行倒排索引检索,获取与所述用户地址数据之间的匹配值满足预设匹配条件的预设数量的预设候选标准地址;每一个所述预设标准地址均包括预设模糊区域信息和预设关键区域信息,所述倒排索引检索结构是根据多个所述预设候选标准地址的预设模糊区域信息所构建;
将所述用户地址数据的待比对关键区域信息与获取的预设数量的所述预设候选标准地址的预设关键区域信息进行对比矫正,获取矫正结果;
在所述矫正结果为矫正成功时,根据矫正成功的所述矫正结果确定出与所述用户地址数据匹配的标准匹配地址,并将所述标准匹配地址代替所述用户登记的用户地址数据。
2.根据权利要求1所述的地址数据的匹配方法,其特征在于,所述通过单词查找树解析出所述用户地址数据的待比对关键区域信息之前,还包括:
预先建造一个初始节点,按照预设前缀特性将所有关键区域信息划分为多个子节点,并根据所述关键区域信息所对应的串集合将所述子节点组装至所述初始节点中。
3.根据权利要求1所述的地址数据的匹配方法,其特征在于,所述根据预设的倒排索引检索结构对所述待比对模糊区域信息进行倒排索引检索之前,还包括:
获取多个所述预设候选标准地址,并通过预设划分规则从所述预设标准地址中分割出预设模糊区域信息和预设关键区域信息;
将一个所述预设模糊区域信息作为一个比对文档,对所述比对文档进行分词,得到多个词条,并生成与每一个所述比对文档对应的文档ID;
将所述比对文档中分词得到的所述词条作为与其对应的文档ID关联的关键字索引,根据所述关键词索引构建所述倒排索引结构。
4.根据权利要求1所述的地址数据的匹配方法,其特征在于,所述根据预设的倒排索引检索结构对所述待比对模糊区域信息进行倒排索引检索,获取与所述用户地址数据之间的匹配值满足预设匹配条件的预设数量的预设候选标准地址,包括:
从所述待比对模糊区域信息划分出多个检索字,根据所述倒排索引检索结构检索出与所述检索字对应的索引关键字,并获取所述索引关键字所关联的所有文档ID;一个所述检索字对应一个所述索引关键字;
对与各所述检索字对应的所有文档ID进行汇总,得到汇总文档ID,将与各所述检索字对应的所有文档ID在所述汇总文档ID中所出现的次数记录为该检索字的目标次数,根据所述目标次数确定各所述文档ID与所述用户地址数据之间的匹配值,并对匹配值进行排序;
将排序之后匹配值序列在先的预设数量的所述文档ID对应的比对文档均记录为目标文档,并将所述倒排索引检索结构中所述目标文档所属的预设候选标准地址记录为与所述用户地理数匹配的预设候选标准地址。
5.根据权利要求1所述的地址数据的匹配方法,其特征在于,所述将所述用户地址数据的待比对关键区域信息与获取的预设数量的所述预设候选标准地址的预设关键区域信息进行对比矫正,获取矫正结果之后,还包括:
在所述矫正结果为矫正失败时,将矫正失败的矫正结果所对应的预设关键区域信息进行剔除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011195424.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种马桶自动装箱装置
- 下一篇:一种有色金属等温熔炉
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置