[发明专利]一种基于词典和机器学习的地址匹配方法在审
申请号: | 201711332274.0 | 申请日: | 2017-12-13 |
公开(公告)号: | CN108052609A | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 金勇;李元 | 申请(专利权)人: | 武汉烽火普天信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 430000 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 词典 机器 学习 地址 匹配 方法 | ||
1.一种基于词典和机器学习的地址匹配方法,包括地址解析模块(1)、地址标准化模块(2)、地址匹配模块(3)和地址筛选模块(4),其特征在于,所述地址解析模块(1)用于将输入的地址信息进行地址解析,解析后的地址数据输入到地址标准化模块(2)经过标准化处理,处理后的地址信息输入到地址匹配模块(3)中进行匹配,匹配到的地址信息利用地址筛选模块(4)的处理得到最终的标准地址信息。
2.根据权利要求1所述的一种基于词典和机器学习的地址匹配方法,其特征在于:在地址解析模块(1)中,利用地址词典对输入的地址信息按照区县、乡镇、村组、居委会、小区、楼幢依次进行解析。
3.根据权利要求1所述的一种基于词典和机器学习的地址匹配方法,其特征在于:在地址标准化模块(2)中,通过对解析出的地址信息进行标准化填充和纠错处理,然后将处理之后的地址信息输入到地址匹配模块(3)中。
4.根据权利要求1所述的一种基于词典和机器学习的地址匹配方法,其特征在于:在地址匹配模块(3)中,对标准化处理之后的地址信息,通过递减查询标准地址数据库的方式,找出接近的多条地址数据信息,将找到的地址信息数据传入到地址筛选模块(4)中。
5.根据权利要求1所述的一种基于词典和机器学习的地址匹配方法,其特征在于:在地址筛选模块(4)中,对查询到地址信息数据,首先利用最小编辑距离的方法找出编辑距离最小的地址,如果有多个最小编辑距离,则利用余弦定理对这些最小编辑距离的地址计算其余弦距离,返回最大余弦距离的地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉烽火普天信息技术有限公司,未经武汉烽火普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711332274.0/1.html,转载请声明来源钻瓜专利网。