[发明专利]一种基于动态语义编码和双注意力的文本匹配方法及装置在审
申请号: | 202010387348.6 | 申请日: | 2020-05-09 |
公开(公告)号: | CN111611346A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 迟殿委 | 申请(专利权)人: | 迟殿委 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06N3/04 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 蔡永波 |
地址: | 264006 山东省烟台市烟台经*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 语义 编码 注意力 文本 匹配 方法 装置 | ||
本发明实施例提供一种基于动态语义编码和双注意力的文本匹配方法及装置,包括:获取待匹配的第一文本和第二文本,对第一文本和第二文本进行动态语义编码并向量化,得到第一语义文本向量和第二语义文本向量;通过LSTM提取第一语义文本向量的上下文向量,根据注意力机制将所有上下文向量形成第一文本全局向量;以及,通过LSTM提取对第二语义文本向量的上下文向量,根据注意力机制将所有上下文向量形成第二文本全局向量;通过线性层计算第一文本全局向量和第二文本全局向量的相似度,判断待匹配的第一文本和第二文本是否匹配。对待匹配文本动态语义编码并向量化,通过LSTM辅以双注意力提炼上下文向量,获得更高的文本匹配精度。
技术领域
本发明涉及语言处理领域,具体涉及一种基于动态语义编码和双注意力的文本匹配方法及装置。
背景技术
语义匹配是自然语言处理领域的一个基本任务,其可以应用到很多实际应用方面。
在实现本发明过程中,申请人发现现有技术中至少存在如下问题:
传统的语义匹配通常依赖于提取某些具体的匹配模式或某些特征,然而这种方式往往会造成过多的误匹配以及很难覆盖住所有的样本。而现有的语义匹配方法存在以下缺点:第一,现有的语义匹配的许多模型都是通过固定词向量编码的方式进行训练的,或者是通过word2vec等技术提前预训练好一批词向量,或者是初始化一个词向量矩阵,然后在训练过程中不断迭代,但在预测过程中,给定不同的文本序列,获得的词向量序列都是一样的,这可能会导致一些歧义现象。第二,现有许多语义匹配模型未将注意力集中在更重要的数据部分,不利于提升模型表现。
发明内容
本发明实施例提供一种基于动态语义编码和双注意力的文本匹配方法及装置,以提升文本的语义匹配精度。
为达上述目的,一方面,本发明实施例提供一种基于动态语义编码和双注意力的文本匹配方法,包括:
获取待匹配的第一文本和第二文本,对第一文本和第二文本进行动态语义编码并向量化,得到第一语义文本向量和第二语义文本向量;
通过双向模型LSTM提取第一语义文本向量的上下文向量,根据注意力机制将所有上下文向量形成第一文本全局向量;以及,通过双向模型LSTM提取对第二语义文本向量的上下文向量,根据注意力机制将所有上下文向量形成第二文本全局向量;
通过线性层计算第一文本全局向量和第二文本全局向量的相似度,判断待匹配的第一文本和第二文本是否匹配。
另一方面,本发明实施例提供一种基于动态语义编码和双注意力的文本匹配装置,包括:
动态编码模块,用于获取待匹配的第一文本和第二文本,对第一文本和第二文本进行动态语义编码并向量化,得到第一语义文本向量和第二语义文本向量;
双注意力模块,用于通过双向模型LSTM提取第一语义文本向量的上下文向量,根据注意力机制将所有上下文向量形成第一文本全局向量;以及,通过双向模型LSTM提取对第二语义文本向量的上下文向量,根据注意力机制将所有上下文向量形成第二文本全局向量;
相似度判断模块,用于通过线性层计算第一文本全局向量和第二文本全局向量的相似度,判断待匹配的第一文本和第二文本是否匹配。
上述技术方案具有如下有益效果:通过对两个待匹配的文本进行动态语义编码并向量化,之后将各编码向量传入双向模型LSTM中,并分别辅以双注意力机制提炼上下文向量,将两个待匹配文本生成各自的全局向量。最后将全局向量传入线性层计算文本相似性得到语义匹配结果,能够获得更高的文本匹配准确度。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于迟殿委,未经迟殿委许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010387348.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锅炉辅助燃烧系统
- 下一篇:微流控芯片、芯片控制装置及其操作方法