[发明专利]地址模糊匹配方法及装置有效
申请号: | 202010541244.6 | 申请日: | 2020-06-15 |
公开(公告)号: | CN111737315B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 徐琳玲;张莹;厉林晨;高峰 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/29 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王涛;汤在彦 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 模糊 匹配 方法 装置 | ||
1.一种地址模糊匹配方法,其特征在于,包括:
分别获取标准数据块中各个目标用户各自对应的多个虚拟记录对,其中,各个所述标准数据块分别用于存储前三层相同的标准地址表,各个所述虚拟记录对分别用于存储各自对应的用户唯一标识与对应的虚拟地址,且所述虚拟地址预先基于位于对应的所述标准地址表的第四层或大于第四层的层级中的详细地址信息获取;
应用各个所述虚拟记录对生成目标有向图,且该目标有向图中的各个边的起始节点为所述用户唯一标识,各个边的目的节点为对应的所述虚拟地址;
在所述目标有向图中进行两次传递方向相反的消息传递,得到存在相似性的各个所述虚拟记录对之间的地址相似度;
基于存在相似性的各个所述虚拟记录对之间的地址相似度输出各个所述目标用户的地址模糊匹配结果;
所述在所述目标有向图中进行两次传递方向相反的消息传递,得到存在相似性的各个所述虚拟记录对之间的地址相似度,包括:
自各个所述起始节点沿所述目标有向图的边向对应的各个所述目的节点进行第一次消息传递,以使各个所述目的节点同时收到与自身虚拟地址相同的各个用户唯一标识;
自各个所述目的节点沿所述目标有向图的边向对应的各个所述起始节点进行与所述第一次消息传递逆向传递的第二次消息传递,以使各个所述起始节点同时收到与自身虚拟地址相同的各个用户唯一标识,并生成各个所述目标用户各自对应的相似记录对,其中,该相似记录对用于存储对应的用户唯一标识与用于所述标准地址表中各层是否相同的相似度信息。
2.根据权利要求1所述的地址模糊匹配方法,其特征在于,所述分别获取标准数据块中各个目标用户各自对应的多个虚拟记录对,包括:
分别获取各个标准数据块各自对应的多个记录对,其中,各个所述记录对分别用于存储各自对应的用户唯一标识与对应的词向量,且该词向量为位于所述标准地址表的第四层或大于第四层的层级中的详细地址信息;
将所在层级相同的所述词向量对应的所述记录对合并至同一数据集合,并所述数据集合内的词向量进行聚类,得到至少一个词向量类;
获取各个所述词向量类的中心点向量,并将所述记录对中的所述词向量替换为对应的中心点向量,得到各个所述记录对各自对应的虚拟记录对。
3.根据权利要求2所述的地址模糊匹配方法,其特征在于,在所述分别获取各个标准数据块各自对应的多个记录对之前,还包括:
根据当前处于可用状态的并发线程的数量,将各个所述目标用户的数据对划分至对应数据的数据块中,其中,所述数据对用于存储各自对应的用户唯一标识与对应的地址信息;
应用各个所述并发线程分别对各自对应的所述数据块中的地址信息进行分词处理;
将经该分词处理得到得各个词汇按预设规则进行分层处理,得到各个所述目标用户各自对应的各层依次关联的标准地址表;
将前三层相同的标准地址表划分至同一标准数据块中。
4.根据权利要求3所述的地址模糊匹配方法,其特征在于,在所述根据当前处于可用状态的并发线程的数量,将各个所述目标用户的数据对划分至对应数据的数据块中之前,还包括:
自预设的存储设备中顺序读取各个所述目标用户的用户唯一标识以及地址数据;
对各个所述地址数据进行预处理,得到各个所述目标用户各自对应的各个地址信息;
基于各个所述目标用户的用户唯一标识以及地址信息生成各个所述目标用户的数据对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010541244.6/1.html,转载请声明来源钻瓜专利网。