[发明专利]一种房屋地址相似度分析方法及装置在审
申请号: | 202110021268.3 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112347221A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 刘铜强 | 申请(专利权)人: | 北京安泰伟奥信息技术有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F40/289 |
代理公司: | 北京卓特专利代理事务所(普通合伙) 11572 | 代理人: | 陈变花;姚燕春 |
地址: | 100176 北京市大兴区北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 房屋 地址 相似 分析 方法 装置 | ||
本申请公开一种房屋地址相似度分析方法及装置。所述方法包括将两房屋地址按照省市区与街道栋号楼层分别进行分割;从街道栋号楼层中提取街道栋号楼层数字字母部分,分别计算两房屋地址省市区部分的第一相似度与两房屋地址街道栋号楼层数字字母部分的第二相似度;根据房屋地址中省市区部分与街道栋号楼层部分的比重确定最终相似度,根据最终相似度执行房屋地址审核。采用本申请技术方案能够提高房屋地址比对的效率。
技术领域
本申请涉及通信技术领域,尤其涉及一种房屋地址相似度分析方法及装置。
背景技术
在涉及到房屋地址的房产、公积金等领域中,需要判断历史房产数据的房屋是否与当前数据的房屋是否为同一套房屋来执行后续业务的流程,早期阶段由人工通过对比历史房产数据与当前房产数据的房屋地址属性来判断是否为同一套房屋。随着业务量的增多,房屋数据量的不断扩大,人工成本也随之增大。
发明内容
本申请提供了一种房屋地址相似度分析方法及装置,使之能应用于实际房屋地址比对的场景中,有效降低人工比对地址的成本,提高房屋地址比对的效率。
本申请提供一种房屋地址相似度分析方法,包括:
将两房屋地址按照省市区与街道栋号楼层分别进行分割;
从街道栋号楼层中提取街道栋号楼层数字字母部分,分别计算两房屋地址省市区部分的第一相似度与两房屋地址街道栋号楼层数字字母部分的第二相似度;
根据房屋地址中省市区部分与街道栋号楼层部分的比重确定最终相似度,根据最终相似度执行房屋地址审核。
如上所述的房屋地址相似度分析方法,其中,将房屋地址按照省市区与街道栋号楼层分别进行分割,具体包括如下子步骤:
若房屋地址首个文字前存在非文字符号,则去除房屋地址首个文字前的符号;
若房屋地址中存在第一类特殊符号,则将房屋地址中存在的第一类特殊符号统一替换为第一预设符号;
从房屋地址中提取街道栋号楼层部分和省市区部分;
若分离出的街道栋号楼层部分和省市区部分中存在第二类特殊符号,则去除街道栋号楼层部分和省市区部分中的第二类特殊符号;
若省市区部分中存在括号,则提取出省市区部分中的括号文本,删除其中的括号并保留文字部分;
若省市区部分中能够匹配到特定字符串,则将特定字符串替换为空字符。
如上所述的房屋地址相似度分析方法,其中,利用正则匹配算法[ \\da-zA-Z\r\n\t,,。·..;;::、!@$%*^`~=+'\|_\\-\\/]从房屋地址中检索首个文字前的符号,去除房屋地址首个文字前的符号。
如上所述的房屋地址相似度分析方法,其中,若房屋地址中存在第一类特殊符号“ー_-—”,则将房屋地址中存在的第一类特殊符号统一替换为第一预设符号“-”。
如上所述的房屋地址相似度分析方法,其中,利用正则匹配算法([0-9A-Z一二三四五六七八九十东西南北甲乙丙]+([\\#\\-一-—/\\\\]|幢栋|栋|橦|幢|座|号楼|号|楼|\\#楼|单元|门|梯|层|组|室|房|户){1,2})+将街道栋号楼层部分提取出来,其他部分作为省市区部分。
如上所述的房屋地址相似度分析方法,其中,若从房屋地址分离出的街道栋号楼层部分和省市区部分中存在第二类特殊符号\r\n\t,,。·..;;::、!@$%*^`~=+'\|_-\\/,则去除省市区部分和街道栋号楼层部分出现的第二类特殊符号。
如上所述的房屋地址相似度分析方法,其中,利用正则匹配算法提取出省市区部分中的括号文本,删除其中的括号并保留文字部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京安泰伟奥信息技术有限公司,未经北京安泰伟奥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110021268.3/2.html,转载请声明来源钻瓜专利网。