[发明专利]一种基于标准地址矩阵加权映射比对地址匹配的方法在审
申请号: | 202010966565.0 | 申请日: | 2020-09-15 |
公开(公告)号: | CN112115144A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 闵圣捷;饶定远;方波;李诗;陈燕秋;马孟云;谢涛;魏卓;唐雷;邓雷雷 | 申请(专利权)人: | 中电科华云信息技术有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/29 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 王一琦 |
地址: | 200000 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标准 地址 矩阵 加权 映射 匹配 方法 | ||
本发明公开一种基于标准地址矩阵加权映射比对地址匹配的方法,其包括如下步骤:基于七个维度拆分读取的待匹配地址,编码拆分后的待匹配地址生成待匹配地址序列;调用预置的N行7列的标准地址矩阵,并将待匹配地址序列与标准地址矩阵中的每行标准地址序列对应匹配,生成N行7列的匹配度矩阵;采用预设的属性权重参数调整N行7列匹配度矩阵并计算得到每行标准地址序列的行匹配度;提取行匹配度最大所映射的标准地址并返回所述标准地址。本发明通过对比待匹配地址与标准地址矩阵,获取匹配相似度最高的标准地址,能够有效判断待匹配地址是否合理,对待匹配地址不合理不合法的分析提供了初选数据。
技术领域
本发明涉及数据处理领域,具体而言,本发明涉及多址接入方法、用于多址接入的发射方法、用于多址接入的发射机和接收机。
背景技术
标准地址库地址包含省、市、区县、乡镇、社区、街路巷、建筑物、门牌号等层级具有格式化的地址信息库。通过人工采集不断完善地址库中的地址信息,将新建和废弃的地址进行更新。通过地址与场所、房屋、企业、实体等各类信息进行对应和建立关系;如此以来地址即可作为通用且具有权威的标识信息,如酒店位置是否准确、是否有工商登记,可以通过采集的地址与标准地址的匹配情况判断是否合理。如何将一个普通地址与标准地址进行匹配,得出一个合理且有效的结果,是一个需要迫切解决的问题。
发明内容
为了寻找更为有效的基于标准地址矩阵加权映射比对地址匹配的实现方案,本发明提供了一种基于标准地址矩阵加权映射比对地址匹配的方法,其包括如下步骤:
基于省、市、县、镇、街路巷、建筑物、门牌号七个维度拆分读取的待匹配地址,编码所述拆分后的待匹配地址生成待匹配地址序列;
调用预置的N行7列的标准地址矩阵,并将所述待匹配地址序列与所述标准地址矩阵中的每行标准地址序列对应匹配,如果匹配一致,则匹配度为1,若否,则匹配度为0,进而生成N行7列的匹配度矩阵,其中,所述N行7列中的N为大于1的自然数,7列对应的属性依次为省、市、县、镇、街路巷、建筑物、门牌号;
采用预设的属性权重参数调整所述N行7列匹配度矩阵并计算得到与所述每行标准地址序列对应的行匹配度,其中所述行匹配度为所述每行标准地址序列中经过调整的各个匹配度之和;
提取行匹配度最大所映射的标准地址并返回所述标准地址。
优选地,所述基于省、市、县、镇、街路巷、建筑物、门牌号七个维度拆分读取的待匹配地址之前包括如下步骤:
预置N行7列的标准地址矩阵。
优选地,所述预置N行7列的标准地址矩阵包括如下步骤:
采集预置区域地面建筑的物理地址数据,使用省、市、县、镇、街路巷、建筑物、门牌号七个维度拆分所述采集的物理地址数据;
按照预设编码规则编码拆分后的所述采集的物理地址数据,映射得到N行7列的标准地址矩阵。
优选地,所述预设编码规则为所述省、市、县按照《中华人民共和国行政区划代码》GBT2260-2007编码,所述镇、街路巷、建筑物、门牌号为自定义编码。
优选地,所述使用省、市、县、镇、街路巷、建筑物、门牌号七个维度拆分所述采集的物理地址数据为通过Jieba中文分词组件拆分。
优选地,所述待匹配地址序列与所述标准地址矩阵中的每行标准地址序列对应匹配包括如下步骤:
将编码后所述待匹配地址序列中的省、市、县、镇、街路巷、建筑物、门牌号分别与所述每行标准地址序列中7列属性之省、市、县、镇、街路巷、建筑物、门牌号的属性值相匹配。
优选地,所述7列预设的属性权重参数包括如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电科华云信息技术有限公司,未经中电科华云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010966565.0/2.html,转载请声明来源钻瓜专利网。