[发明专利]结合深度卷积网络和注意力机制的地址匹配方法以及装置有效
申请号: | 202210643386.2 | 申请日: | 2022-06-08 |
公开(公告)号: | CN114911909B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 陈逸舟;张丹;熊晓菁 | 申请(专利权)人: | 北京青萌数海科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京智沃律师事务所 11620 | 代理人: | 梁晨 |
地址: | 100022 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 深度 卷积 网络 注意力 机制 地址 匹配 方法 以及 装置 | ||
本申请公开了一种结合深度卷积网络和注意力机制的地址匹配方法以及地址匹配装置,属于人工智能技术领域,方法包括:输入待匹配的第一地址文本和第二地址文本;训练地址语义提取模型;通过地址语义提取模型,将地址文本逐字转化为文本向量;训练包括输入层、卷积层、池化层和输出层深度卷积神经网络模型;将文本向量输入至输入层,在输入层中引入注意力机制,获取交互关系特征矩阵,对文本向量和关系特征矩阵进行叠加;在卷积层中定义卷积核,对文本向量沿文本方向进行卷积;在池化层中引入注意力机制,对卷积后的向量进行池化处理,输出输出向量;在输出层中,建立逻辑回归模型,判断两个输出向量是否匹配,输出两个地址文本是否匹配的结果。
技术领域
本申请属于人工智能技术领域,具体涉及一种结合深度卷积网络和注意力机制的地址匹配方法以及地址匹配装置。
背景技术
地址匹配作为地址解析研究方向的重要部分,其基本任务形式就是在输入两条地址文本时,判断两者描述的是否为同一地点。地址的描述性文本具有表达多样化、不规范、字符串长度不固定等特征,在不考虑模糊地址、错误地址的情况下,每一条地址文本都应对应到地图上一个确定的空间位置,然而同一个空间位置却有可能对应多种不同的地址描述。因此,进行地址匹配通常是地址数据预处理、地点关联查询、推荐、以及其他空间数据挖掘任务的基础技术。目前主流的地址匹配技术,包括基于文本相似性、基于地址要素解析、基于深度学习三大类。
当出现字面几乎没有重叠、但是指向同一地点的地址文本时,上述的基于文本相似性和基于地址要素解析的方法基本都无法正确识别。随着城市大数据的快速发展,可以看到越来越多地出现没有标准结构、表达方式各异的地址数据。为了解决上述问题,近年来的相关研究开始考虑地址语义,并引入深度学习的方法进行地址匹配。
但是目前的相关研究主要还是依靠自然语言分词+词嵌入提取语义+输出模型的流程,在有限的训练数据内,地址文本的语义信息难以得到充分的挖掘利用,地址语义理解和匹配能力不足。另外,简单通用的输出模型对于地址匹配的准确性不足,还需要通过建立针对性的深度神经网络结构进行提升。
发明内容
本申请实施例的目的是提供一种结合深度卷积网络和注意力机制的地址匹配方法及地址匹配装置,能够解决现有的地址匹配方法在有限的训练数据内,地址文本的语义信息难以得到充分的挖掘利用,存在地址语义理解能力和匹配能力不足的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种结合深度卷积网络和注意力机制的地址匹配方法,包括:
输入待匹配的第一地址文本和第二地址文本;
训练地址语义提取模型;
通过地址语义提取模型,将第一地址文本逐字转化为第一文本向量,将第二地址文本逐字转化为第二文本向量;
训练结合注意力机制的深度卷积神经网络模型,其中,深度卷积神经网络模型包括输入层、卷积层、池化层和输出层;
将第一文本向量和第二文本向量输入至输入层,在输入层中引入注意力机制,获取第一文本向量和第二文本向量之间的交互关系特征矩阵,对第一文本向量和第一关系特征矩阵、第二文本向量和第二关系特征矩阵进行叠加,进入卷积层;
在卷积层中定义卷积核,对第一文本向量和第二文本向量沿文本方向进行卷积,在文本两侧分别使用0做填充处理,进入池化层;
在池化层中引入注意力机制,对卷积后的向量进行池化处理,输出第一输出向量和第二输出向量,进入输出层;
在输出层中,建立逻辑回归模型,判断第一输出向量和第二输出向量是否匹配,输出第一地址文本和第二地址文本是否匹配的结果。
可选地,训练地址语义提取模型,具体包括:
收集地址文本语料库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京青萌数海科技有限公司,未经北京青萌数海科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210643386.2/2.html,转载请声明来源钻瓜专利网。