[发明专利]地址信息处理方法、装置、移动终端及存储介质在审
申请号: | 202310372010.7 | 申请日: | 2023-04-10 |
公开(公告)号: | CN116501834A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 杨春阳;邢启洲;李健;陈明;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100193 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 信息处理 方法 装置 移动 终端 存储 介质 | ||
1.一种地址信息处理方法,其特征在于,所述方法包括:
根据输入地址片段对预先设置的标准地址库进行匹配并获取匹配结果,其中,所述标准地址库存储有标准地址信息;
根据所述匹配结果获取所述标准地址信息中的多个第一候选地址信息;
根据多个所述第一候选地址信息对所述输入地址片段进行相似度计算获取第一相似度计算结果,其中,所述相似度计算包括基于编辑距离的相似度计算和基于拼音的语义相似度计算;
根据所述相似度计算结果最高的第一候选地址信息对所述输入地址片段进行地址信息补全,获取第一地址信息处理结果。
2.根据权利要求1所述的方法,其特征在于,所述根据输入地址片段对预先设置的标准地址库进行匹配并获取匹配结果之前还包括:
对所述输入地址片段对应的原始地址片段进行标准化处理获取所述输入地址片段。
3.根据权利要求1所述的方法,其特征在于,所述根据输入地址片段对预先设置的标准地址库进行匹配并获取匹配结果之前,还包括:
根据所述标准地址信息按照字符生成前缀树;
生成所述标准地址信息与对应地址库中记录索引的映射;
根据所述前缀树和所述映射构建所述标准地址库。
4.根据权利要求3所述的方法,其特征在于,所述匹配结果包括第一匹配结果,所述根据输入地址片段对预先设置的标准地址库进行匹配并获取匹配结果包括:
获取所述输入地址片段对应的多个字符;
将多个所述字符按照预先设置的顺序进入所述标准地址库中进行查询,并生成所述第一匹配结果。
5.根据权利要求4所述的方法,其特征在于,所述匹配结果包括第二匹配结果,所述获取所述输入地址片段对应的多个字符之后还包括:
对多个字符进行地址分级,得到多个级别的字符;
将所述多个级别的字符按照级别顺序进入所述标准地址库中对应级别的前缀树中进行查询,并生成所述第二匹配结果。
6.根据权利要求5所述的方法,其特征在于,所述根据多个所述第一候选地址信息对所述输入地址片段进行相似度计算获取第一相似度计算结果包括:
根据多个所述第一候选地址信息按照级别构建集束搜索树;
按照级别顺序对所述第一候选地址信息和所述输入地址片段进行相似度计算获取所述第一相似度计算结果。
7.根据权利要求1所述的方法,其特征在于,所述根据输入地址片段对预先设置的标准地址库进行匹配并获取匹配结果,其中,所述标准地址库存储有标准地址信息之后,还包括:
当所述匹配结果为无法匹配时,根据输入地址片段对预先设置的标准地址库进行模糊匹配,获取所述标准地址信息中的多个第二候选地址信息;
根据多个所述第二候选地址信息对所述输入地址片段进行相似度计算获取第二相似度计算结果,其中,所述相似度计算包括基于编辑距离的相似度计算和基于拼音的语义相似度计算;
根据所述相似度计算结果最高的第二候选地址信息对所述输入地址片段进行地址信息补全,获取第二地址信息处理结果。
8.一种地址信息处理装置,其特征在于,包括:
第一匹配模块,用于根据输入地址片段对预先设置的标准地址库进行匹配并获取匹配结果;
第一候选获取模块,用于根据所述匹配结果获取所述标准地址信息中的多个第一候选地址信息;
第一计算模块,用于根据多个所述第一候选地址信息对所述输入地址片段进行相似度计算获取第一相似度计算结果,其中,所述相似度计算包括基于编辑距离的相似度计算和基于拼音的语义相似度计算;
第一补全模块,用于根据所述相似度计算结果最高的第一候选地址信息对所述输入地址片段进行地址信息补全,获取第一地址信息处理结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310372010.7/1.html,转载请声明来源钻瓜专利网。