[发明专利]地址文本识别方法、装置、介质、电子设备在审

专利信息
申请号: 202010457096.X 申请日: 2020-05-26
公开(公告)号: CN111695355A 公开(公告)日: 2020-09-22
发明(设计)人: 李响;王伟 申请(专利权)人: 平安银行股份有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06N3/04;G06N3/08
代理公司: 深圳市隆天联鼎知识产权代理有限公司 44232 代理人: 甄伟军
地址: 518000 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 地址 文本 识别 方法 装置 介质 电子设备
【说明书】:

本公开涉及计算机技术领域,揭示了一种地址文本识别方法、装置、介质及电子设备。该方法包括:获取待识别的地址文本;对所述待识别的地址文本进行分词,得到包括至少一个字符串的字符串序列;根据预先训练的地址语言模型,对所述字符串序列的至少一种特征进行检测;在所述字符串序列的至少一种特征存在错误时,通过所述地址语言模型对所述存在错误的至少一种特征进行修正,以识别出正确的地址文本。此方法下,通过预先训练的地址语言模型可以充分地挖掘地址文本中蕴含的地址语义信息,能够较好地对文本地址进行纠错与补全,提高对地址文本进行识别的准确性。

技术领域

本公开涉及计算机技术领域,特别地,涉及一种地址文本识别方法、装置、介质和电子设备。

背景技术

在如今,地名地址的识别与匹配在物流、金融等各行各业都有着较为成熟的应用场景。目前,主流的地址识别技术,大多以机器学习分词与传统信息检索相结合的思路作为实现方案。然而,上述思路受限于分词效果,以及检索语料本身的丰富度,无法很好地识别乱序、文字错漏、信息缺失的地址样本,没有从语义层面去提取地址文本信息。可见,如何提高对地址文本进行识别的准确性是亟待解决的技术问题。

发明内容

本公开的目的在于提供一种地址文本识别方法及装置、计算机可读存储介质、电子设备,进而至少可以提高对地址文本进行识别的准确性。

本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。

根据本公开实施例的一个方面,提供了一种地址文本识别方法,所述方法包括:获取待识别的地址文本;对所述待识别的地址文本进行分词,得到包括至少一个字符串的字符串序列;根据预先训练的地址语言模型,对所述字符串序列的至少一种特征进行检测;在所述字符串序列的至少一种特征存在错误时,通过所述地址语言模型对所述存在错误的至少一种特征进行修正,以识别出正确的地址文本。

根据本公开实施例的一个方面,提供了一种地址文本识别装置,包括:获取单元,被用于获取待识别的地址文本;分词单元,被用于对所述待识别的地址文本进行分词,得到包括至少一个字符串的字符串序列;检测单元,被用于根据预先训练的地址语言模型,对所述字符串序列的至少一种特征进行检测;修正单元,被用于在所述字符串序列的至少一种特征存在错误时,通过所述地址语言模型对所述存在错误的至少一种特征进行修正,以识别出正确的地址文本。

根据本公开实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序包括可执行指令,当该可执行指令被处理器执行时,实现如上述实施例中所述的地址文本识别方法。

根据本公开实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储所述处理器的可执行指令,当所述可执行指令被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的地址文本识别方法。

在本公开一些实施例的技术方案中,通过对获取到的待识别的地址文本进行分词,得到包括至少一个字符串的字符串序列,根据预先训练的地址语言模型,对所得到的字符串序列进行特征检测,以检测所述字符串序列是否存在错误特征,在所述字符串序列存在特征错误时,修正所述字符串序列存在的错误特征。由于预先训练的地址语言模型,能够充分地挖掘字符串序列中字符串蕴含的地址层级、地址关联以及地址语义等信息,故而能检测出字符串序列存在的错误特征,通过修正所述字符串序列存在的错误特征,可以得到正确的地址文本,因此,本公开一些实施例的技术方案能够提高对地址文本进行识别的准确性。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

通过参照附图详细描述其示例性实施例,本公开的上述和其它特征及优点将变得更加明显。

图1示出了根据本公开一个实施例的地址文本识别方法的应用场景示意图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010457096.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top