[发明专利]地址识别方法、装置、电子设备以及存储介质有效
申请号: | 202011211412.1 | 申请日: | 2020-11-03 |
公开(公告)号: | CN112329467B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 张龙 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁;张海秀 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 识别 方法 装置 电子设备 以及 存储 介质 | ||
本申请实施例公开了一种地址识别方法、装置、电子设备以及存储介质,可适用于人工智能、大数据、以及地图等领域。该方法包括:获取待识别地址文本;获取待识别地址文本的识别指导信息,其中,识别指导信息包括待识别地址文本包含的词的基础信息、目标地址词的标识信息、或者字的特征信息中的至少一项,其中,目标地址词的标识信息表征了目标地址词的识别结果;根据待识别地址文本和识别指导信息,得到待识别地址文本的地址角色识别结果。采用本申请实施例,可通过待识别地址文本的和待识别地址文本的识别指导信息,来得到待识别地址文本的地址角色识别结果,准确率高。
技术领域
本申请涉及人工智能、大数据处理、以及地图技术领域,尤其涉及一种地址识别方法、装置、电子设备以及存储介质。
背景技术
随机人工智能(Artificial Intelligence,AI)和大数据的不断发展,文本识别成为其中最为重要的技术之一。在地址角色识别的场景中,需要对待识别的地址文本行地址角色识别。
现有方案中,由于对于待识别的地址文本的理解能力不足,容易造成地址识别错误。例如,地址“邯郸市怡园街开元壹号院4-7号”,其中的开元表示的是开元小区,壹号院表示楼栋,而在结构几乎一样的地址“海淀区永丰路西山壹号院5号楼”中,西山壹号院则作为一个整体表示一个小区名。现有方案在地址识别时,并不能将两个来源不同的地址中的“壹号院”进行有效的区分。也就是说,现有地址识别的方案中,对于不同来源地址存在泛化能力弱的问题。
因此,如何提升地址识别的准确率,成为亟需解决的问题。
发明内容
本申请实施例提供一种地址识别方法、装置、电子设备以及存储介质,可通过待识别地址文本的和待识别地址文本的识别指导信息,来得到待识别地址文本的地址角色识别结果,能够有效提高识别的准确性。
第一方面,本申请实施例提供一种地址识别方法,该方法包括:
获取待识别地址文本;
获取上述待识别地址文本的识别指导信息,其中,上述识别指导信息包括上述待识别地址文本包含的词的基础信息、目标地址词的标识信息、或者字的特征信息中的至少一项,其中,上述目标地址词的标识信息表征了上述目标地址词的识别结果;
根据上述待识别地址文本和上述识别指导信息,得到上述待识别地址文本的地址角色识别结果。
第二方面,本申请实施例提供了一种地址识别装置,该地址识别装置包括:
待识别文本获取模块,用于获取待识别地址文本;
指导信息获取模块,用于获取上述待识别地址文本的识别指导信息,其中,上述识别指导信息包括上述待识别地址文本包含的词的基础信息、目标词的标识信息、或者字的特征信息中的至少一项;
地址识别模块,用于根据上述待识别地址文本和上述识别指导信息,得到上述待识别地址文本的地址角色识别结果。
在一些可行的实施方式中,上述装置还包括:地址关键词词库构建模块,用于构建地址关键词词库,其中,上述地址关键词词库中包括地址关键词、以及地址关键词的标识信息;上述指导信息获取模块,用于:基于上述地址关键词词库,确定上述待识别地址文本在上述地址关键词词库中命中的地址关键词,将命中的上述地址关键词确定为目标地址词;基于上述地址关键词词库,得到上述目标地址词的标识信息。
在一些可行的实施方式中,上述词的基础信息包括词的词性信息或者词在上述待识别地址文本中的位置信息中的至少一项。
在一些可行的实施方式中,上述字的特征信息包括字的拼音信息或者字的形态信息中的至少一项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011211412.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种传感器数据处理系统
- 下一篇:一种多微网主体非合作博弈交易方法