[发明专利]融合多维相似度与规则集合的地址模糊匹配方法及系统在审
申请号: | 202011395883.2 | 申请日: | 2020-12-03 |
公开(公告)号: | CN112581252A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 刘志斌;施明强;方俊炜;刘日佳 | 申请(专利权)人: | 信用生活(广州)智能科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06F16/2458;G06F16/29;G06K9/62 |
代理公司: | 广东高端专利代理事务所(特殊普通合伙) 44346 | 代理人: | 刘广新 |
地址: | 510000 广东省广州市海珠区宸悦*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 多维 相似 规则 集合 地址 模糊 匹配 方法 系统 | ||
1.一种融合多维相似度与规则集合的地址模糊匹配方法,其特征在于,所述方法包括:
基于标准地址库对标准地址进行预处理,得到待匹配信息;其中,所述待匹配信息包括所述标准地址、对应于所述标准的地址详细信息及待匹配地址;
提取所述待匹配信息的地址特征;
基于所述待匹配信息及所述地址特征,采用相似度计算模型计算所述标准地址与所述待匹配地址的第一相似度;
基于所述待匹配信息及所述地址特征,采用比对规则集合计算所述标准地址与所述待匹配地址的第二相似度;
采用所述第二相似度调整所述第一相似度,得到所述标准地址相对所述待匹配地址的总体相似度。
2.根据权利要求1所述的方法,其特征在于,所述基于标准地址库对标准地址进行预处理,得到待匹配信息,包括:
提取所述标准地址中存在的地址层级字符及对应于所述地址层级字符的地址名称字符,作为所述标准地址对应的地址详细信息;
基于所述地址详细信息中包括的地址层级字符与对应的地址名称字符,采用倒排索引在所述标准地址库中检索与所述标准地址近似度最高的待匹配地址;
整合所述标准地址、所述地址详细信息及所述待匹配地址,作为所述待匹配信息。
3.根据权利要求2所述的方法,其特征在于,所述提取所述待匹配信息的地址特征,包括:
检测所述标准地址及所述待匹配地址的字符长度;
统计所述待匹配信息中若干地址名称字符的词频;
计算所述标准地址与所述待匹配地址的莱文斯坦距离;
整合所述字符长度、所述若干地址名称字符的词频及所述莱文斯坦距离,作为所述待匹配信息的地址特征。
4.根据权利要求1所述的方法,其特征在于,在所述基于标准地址库对标准地址进行预处理,得到待匹配信息之前,所述方法还包括:
获取用户提交的原始地址;
依据预设地址命名规则处理所述原始地址,得到规范地址;
提取所述规范地址的行政区划信息,基于标准地址库对所述规范地址的行政区划信息进行鉴别,筛除所述规范地址中存在的虚假地址及模糊地址,得到所述标准地址。
5.根据权利要求1~4任一项所述的方法,其特征在于,所述方法还包括:
将所述标准地址及所述标准地址对应的地址详细信息与地址特征录入所述标准地址库,更新所述标准地址库;
根据更新完成的所述标准地址库对所述相似度计算模型进行增量训练;
获取所述相似度计算模型中若干地址层级字符对应的权重值更新所述比对规则集合。
6.一种融合多维相似度与规则集合的地址模糊匹配系统,其特征在于,所述系统包括:
预处理单元,用于基于标准地址库对标准地址进行预处理,得到待匹配信息;其中,所述待匹配信息包括所述标准地址、对应于所述标准的地址详细信息及待匹配地址;
特征提取单元,用于提取所述待匹配信息的地址特征;
第一匹配单元,用于基于所述待匹配信息及所述地址特征,采用相似度计算模型计算所述标准地址与所述待匹配地址的第一相似度;
第二匹配单元,用于基于所述待匹配信息及所述地址特征,采用比对规则集合计算所述标准地址与所述待匹配地址的第二相似度;
匹配调整单元,用于采用所述第二相似度调整所述第一相似度,得到所述标准地址相对所述待匹配地址的总体相似度。
7.根据权利要求6所述的系统,其特征在于,所述预处理单元包括:
信息提取子单元,用于提取所述标准地址中存在的地址层级字符及对应于所述地址层级字符的地址名称字符,作为所述标准地址对应的地址详细信息;
地址检索子单元,用于基于所述地址详细信息中包括的地址层级字符与对应的地址名称字符,采用倒排索引在所述标准地址库中检索与所述标准地址近似度最高的待匹配地址;
整合子单元,用于整合所述标准地址、所述地址详细信息及所述待匹配地址,作为所述待匹配信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于信用生活(广州)智能科技有限公司,未经信用生活(广州)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011395883.2/1.html,转载请声明来源钻瓜专利网。