[发明专利]一种房屋地址相似度分析方法及装置在审
申请号: | 202110021268.3 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112347221A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 刘铜强 | 申请(专利权)人: | 北京安泰伟奥信息技术有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F40/289 |
代理公司: | 北京卓特专利代理事务所(普通合伙) 11572 | 代理人: | 陈变花;姚燕春 |
地址: | 100176 北京市大兴区北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 房屋 地址 相似 分析 方法 装置 | ||
1.一种房屋地址相似度分析方法,其特征在于,包括:
将两房屋地址按照省市区与街道栋号楼层分别进行分割;
从街道栋号楼层中提取街道栋号楼层数字字母部分,分别计算两房屋地址省市区部分的第一相似度与两房屋地址街道栋号楼层数字字母部分的第二相似度;
根据房屋地址中省市区部分与街道栋号楼层部分的比重确定最终相似度,根据最终相似度执行房屋地址审核。
2.如权利要求1所述的房屋地址相似度分析方法,其特征在于,将房屋地址按照省市区与街道栋号楼层分别进行分割,具体包括如下子步骤:
若房屋地址首个文字前存在非文字符号,则去除房屋地址首个文字前的符号;
若房屋地址中存在第一类特殊符号,则将房屋地址中存在的第一类特殊符号统一替换为第一预设符号;
从房屋地址中提取街道栋号楼层部分和省市区部分;
若分离出的街道栋号楼层部分和省市区部分中存在第二类特殊符号,则去除街道栋号楼层部分和省市区部分中的第二类特殊符号;
若省市区部分中存在括号,则提取出省市区部分中的括号文本,删除其中的括号并保留文字部分;
若省市区部分中能够匹配到特定字符串,则将特定字符串替换为空字符。
3.如权利要求2所述的房屋地址相似度分析方法,其特征在于,利用正则匹配算法从房屋地址中检索首个文字前的符号,去除房屋地址首个文字前的符号。
4.如权利要求2所述的房屋地址相似度分析方法,其特征在于,若房屋地址中存在第一类特殊符号“ー_-—”,则将房屋地址中存在的第一类特殊符号统一替换为第一预设符号“-”。
5.如权利要求2所述的房屋地址相似度分析方法,其特征在于,利用正则匹配算法([0-9A-Z一二三四五六七八九十东西南北甲乙丙]+([\\#\\-一-—/\\\\]|幢栋|栋|橦|幢|座|号楼|号|楼|\\#楼|单元|门|梯|层|组|室|房|户){1,2})+将街道栋号楼层部分提取出来,其他部分作为省市区部分。
6.如权利要求2所述的房屋地址相似度分析方法,其特征在于,若从房屋地址分离出的街道栋号楼层部分和省市区部分中存在第二类特殊符号,则去除省市区部分和街道栋号楼层部分出现的第二类特殊符号。
7.如权利要求2所述的房屋地址相似度分析方法,其特征在于,利用正则匹配算法提取出省市区部分中的括号文本,删除其中的括号并保留文字部分。
8.如权利要求2所述的房屋地址相似度分析方法,其特征在于,利用正则匹配算法[0-9A-Za-z\\#]+(单元|楼|室|层|米|户|\\#)将省市区部分匹配到的字符串替换为空字符;以及利用正则匹配算法[一二三四五六七八九十]+(单元|楼|室|层|米|户)将省市区部分匹配到的字符串替换为空字符。
9.如权利要求1所述的房屋地址相似度分析方法,其特征在于,为房屋地址中的省市区部分设置第一比重,为街道栋号楼层设置第二权重,计算最终相似度=省市区部分相似度*第一比重+街道栋号楼层部分*第二比重。
10.一种房屋地址相似度分析装置,其特征在于,所述装置执行如权利要求1-9任一项所述的房屋地址相似度分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京安泰伟奥信息技术有限公司,未经北京安泰伟奥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110021268.3/1.html,转载请声明来源钻瓜专利网。