[发明专利]地址信息处理方法、装置、移动终端及存储介质在审
申请号: | 202310372010.7 | 申请日: | 2023-04-10 |
公开(公告)号: | CN116501834A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 杨春阳;邢启洲;李健;陈明;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100193 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 信息处理 方法 装置 移动 终端 存储 介质 | ||
本申请提供地址信息处理方法、装置、移动终端及存储介质。处理方法包括根据输入地址片段对预先设置的标准地址库进行匹配并获取匹配结果,其中,标准地址库存储有标准地址信息;根据匹配结果获取标准地址信息中的多个第一候选地址信息;根据多个第一候选地址信息对输入地址片段进行相似度计算获取第一相似度计算结果,相似度计算包括基于编辑距离的相似度计算和基于拼音的语义相似度计算;根据相似度计算结果最高的第一候选地址信息对输入地址片段进行地址信息补全,获取第一地址信息处理结果。由于地址信息处理方法中相似度计算基于编辑距离和拼音,避免了用户输入地址信息错误导致处理偏差的问题,提高了补全修正的准确性。
技术领域
本申请涉及计算机技术领域,尤其涉及一种地址信息处理方法、装置、移动终端及存储介质。
背景技术
用户通常通过自然语言描述地址信息,询问地址信息相关内容,但自然语言描述的地址信息往往不够准确,企业预设的自动智能回复或智能客服无法将自然语言的地址信息与预先存储的地址信息进行简单匹配。所以需要对用户的自然语言识别并进行地址信息的补全,从而辅助自动智能回复、智能客服等工具回答用户问题,提升地址信息相关提问的回答效率,更快解决用户问题。
针对上述问题,现有的地址信息处理方法采用倒排索引,根据对用户输入的自然语言召回标准地址库中候选的地址信息,再采用语义模型、字符相似度等方法确定自然语言对应的地址信息。但是,这种方法判断地址信息完全依赖于用户输入的自然语言,当用户输入的自然语言顺序错误、重复或错别字时,现有的地址信息处理方法不能进行排除,根据错误的自然语言获取的地址信息不能满足用户需求,造成地址信息处理方法准确率低的问题。
发明内容
本申请实施例提供了一种地址信息处理方法、装置、移动终端及存储介质。由于本申请实施例提供的地址信息处理方法基于编辑距离和拼音对输入地址片段和第一候选地址信息进行相似度计算,可以综合考虑用户输入地址信息可能对应的所有标准地址信息,避免了因用户输入地址信息颠倒、别字等问题导致现有基于语义模型或基于字符相似度等方法判断偏差的问题,提高了地址信息补全的准确性。
为了解决上述技术问题,本申请提供了一种地址信息处理方法,包括:
根据输入地址片段对预先设置的标准地址库进行匹配并获取匹配结果,其中,标准地址库存储有标准地址信息;
根据匹配结果获取标准地址信息中的多个第一候选地址信息;
根据多个第一候选地址信息对输入地址片段进行相似度计算获取第一相似度计算结果,其中,相似度计算包括基于编辑距离的相似度计算和基于拼音的语义相似度计算;
根据相似度计算结果最高的第一候选地址信息对输入地址片段进行地址信息处理,获取第一地址信息处理结果。
可选的,本申请提供的地址信息处理方法还包括:
对输入地址片段对应的原始地址片段进行标准化处理获取输入地址片段。
可选的,本申请提供的地址信息处理方法还包括:
根据标准地址信息按照字符生成前缀树;
生成标准地址信息与对应地址库中记录索引的映射;
根据前缀树和映射构建标准地址库。
可选的,本申请提供的地址信息处理方法还包括:
获取输入地址片段对应的多个字符;
将多个字符按照预先设置的顺序进入标准地址库进行查询,并生成第一匹配结果。
可选的,本申请提供的地址信息处理方法还包括:
对多个字符进行地址分级,得到多个级别的字符;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310372010.7/2.html,转载请声明来源钻瓜专利网。