[发明专利]地址标准化方法及装置在审
申请号: | 201910319076.3 | 申请日: | 2019-04-19 |
公开(公告)号: | CN110046352A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 陶建峰 | 申请(专利权)人: | 无锡伽玛信息科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/31;G06F16/387 |
代理公司: | 无锡派尔特知识产权代理事务所(普通合伙) 32340 | 代理人: | 杨立秋 |
地址: | 214000 江苏省无锡市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词条 地址代码 地址信息 地址标准化 获取地址 字符串 地址信息处理 地址信息转换 地址分词 分词处理 匹配成功 词条库 预存 申请 排序 匹配 纠正 | ||
1.一种地址标准化方法,其特征在于,所述地址标准化方法包括:
获取地址信息;
利用地址分词器对所述地址信息进行分词处理,得到至少一个地址词条;
依次将各个地址词条与标准词条库中的标准词条进行匹配;
根据预存的标准词条与地址代码之间的对应关系,获取与匹配成功的词条对应的地址代码;
按照各个地址词条在所述地址信息中的排列顺序,将各个地址词条所对应的地址代码排序,形成所述地址信息对应的地址代码的字符串。
2.根据权利要求1所述的地址标准化方法,其特征在于,在所述获取与匹配成功的词条对应的地址代码后,所述地址标准化方法还包括:
检测所述地址信息中各个地址词条对应的地址代码是否符合代码规则;
若所述地址信息中各个地址词条对应的地址代码符合所述代码规则,则执行按照各个地址词条在所述地址信息中的排列顺序,将各个地址词条所对应的地址代码拼接形成字符串的步骤;
若所述地址信息中各个地址词条对应的地址代码不符合所述代码规则,则将所述地址信息输入至所述地址分词器的学习引擎进行深度学习。
3.根据权利要求1所述的地址标准化方法,其特征在于,在所述依次将各个地址词条与标准词条库中的标准词条进行匹配之后,所述地址标准化方法还包括:
在地址词条与所述标准词条库中的标准词条无法匹配成功时,将所述地址词条与预存的非标准词条库中的非标准词条进行匹配;
在所述地址词条与所述非标准词条库中的非标准词条匹配成功时,将所述非标准词条的匹配次数加1;
在所述地址词条与所述非标准词条库中的非标准词条未匹配成功时,将所述地址词条作为非标准词条加入所述非标准词条库中,并将所述非标准词条的匹配次数记为1。
4.根据权利要求3所述的地址标准化方法,其特征在于,所述地址标准化方法还包括:
在所述非标准词条库中的非标准词条的匹配次数达到预定阈值时,将所述非标准词条作为标准词条加入所述标准词条库中;
所述地址标准化方法还包括:
当所述非标准词条库中的非标准词条的匹配次数在预定时长内未达到所述预定阈值时,则将所述非标准词条从所述非标准词条库中删除,所述预定时长的起始时刻为所述非标准词条被放入至所述非标准词条库的时刻。
5.根据权利要求1所述的地址标准化方法,其特征在于,所述标准词条库中的标准词条为按照预定加密方式进行加密处理后的短地址密文;
所述依次将各个地址词条与标准词条库中的标准词条进行匹配,包括:
依次将各个地址词条按照所述预定加密方式进行加密处理,将得到的短地址密文与所述标准词条库中的标准词条的短地址密文进行匹配。
6.一种地址标准化装置,其特征在于,所述地址标准化装置包括:
第一获取模块,被配置为获取地址信息;
分词模块,被配置为利用地址分词器对所述第一获取模块获取的所述地址信息进行分词处理,得到至少一个地址词条;
第一匹配模块,被配置为依次将所述分词模块得到的各个地址词条与标准词条库中的标准词条进行匹配;
第二获取模块,被配置为根据预存的标准词条与地址代码之间的对应关系,获取与所述第一匹配模块匹配成功的词条对应的地址代码;
排序模块,被配置为按照各个地址词条在所述地址信息中的排列顺序,将各个地址词条所对应的地址代码排序,形成所述地址信息对应的地址代码的字符串。
7.根据权利要求6所述的地址标准化装置,其特征在于,所述地址标准化装置还包括:
检测模块,被配置为检测所述地址信息中各个地址词条对应的地址代码是否符合代码规则;
所述排序模块,还被配置为在所述检测模块检测到所述地址信息中各个地址词条对应的地址代码符合所述代码规则时,各个地址词条在所述地址信息中的排列顺序,将各个地址词条所对应的地址代码排序,形成所述地址信息对应的地址代码的字符串;
深度学习模块,被配置为在所述检测模块检测到所述地址信息中各个地址词条对应的地址代码不符合所述代码规则时,将所述地址信息输入至所述地址分词器的学习引擎进行深度学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡伽玛信息科技有限公司,未经无锡伽玛信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910319076.3/1.html,转载请声明来源钻瓜专利网。