[发明专利]问答文本的语义匹配方法、装置、介质及电子设备在审
申请号: | 201811563115.6 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109726396A | 公开(公告)日: | 2019-05-07 |
发明(设计)人: | 李渊;贺国秀 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 章侃铱;李玉锁 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 特征信息 文本语义 语义匹配 句法结构 全局特征 单词 匹配 循环神经网络 注意力机制 电子设备 局部特征 局部语义 句法特征 句法信息 匹配技术 单一化 有效地 抽取 学习 | ||
本公开提供了一种问答文本的语义匹配方法,该方法可以有效地解决相关技术中的问题。例如,在相关技术中基于深度学习模型的问答文本语义匹配技术,其只能提供上下文局部语义特征信息,缺少背景全局特征信息和问答文本的句法特征信息,导致特征单一化,不能完全体现问答文本的语义匹配信息。而本发明提供了一种基于多级特征和深度学习的问答文本语义匹配方法,对问答文本的单词和句法信息进行单词和句法结构分布式表示,并使用循环神经网络提取问答文本的上下文局部特征信息和句法结构特征信息,然后运用注意力机制抽取背景全局特征信息,使问答文本的特征信息更丰富,从而提高问答文本语义匹配的准确性。
技术领域
本发明涉及自然语言处理技术领域,具体而言,涉及一种问答文本的语义匹配方法、装置、介质及电子设备。
背景技术
目前,基于深度学习的问答文本语义匹配的方法可以包含以下步骤:基于神经网络训练的词嵌入模型对文本进行词向量表示,其表示语义能力更强。通过构建长短时记忆网络LSTM(Long Short-Term Memory)或门控循环单元GRU(Gated Recurrent Unit)等深度学习等模型对文本建模。虽然这些方法对特征选取依赖性较低,一定程度上提取了文本浅层语义信息和上下文局部特征,但不能提取大量重点全局特征和句法结构特征,因此降低了问答文本语义匹配的准确性。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种问答文本的语义匹配方法、装置、介质及电子设备,进而至少可以在一定程度上克服问答文本语义匹配的准确性较低的问题。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的第一方面,提供了一种问答文本的语义匹配方法,包括:利用循环神经网络获取问题文本的具有上下文局部特征和句法结构特征的多级特征向量序列,以及获取候选答案文本的具有上下文局部特征和句法结构特征的多级特征向量序列;基于所述问题文本的具有上下文局部特征和句法结构特征的多级特征向量序列和所述问题文本的具有上下文局部特征和句法结构特征的多级特征向量序列中每个特征向量的注意力权重,生成所述问题文本的具有上下文局部特征、句法结构特征的和全局特征的特征向量,以及基于所述候选答案文本的具有上下文局部特征和句法结构特征的多级特征向量序列和所述候选答案文本的具有上下文局部特征和句法结构特征的多级特征向量序列中每个特征向量的注意力权重,生成所述候选答案文本的具有上下文局部特征、句法结构特征的和全局特征的特征向量;根据所述问题文本的具有上下文局部特征、句法结构特征的和全局特征的特征向量和所述候选答案文本的具有上下文局部特征、句法结构特征的和全局特征的特征向量,确定所述问题文本与所述候选答案文本的语义匹配度。
在本发明的一些实施例中,在利用循环神经网络获取问题文本的具有上下文局部特征和句法结构特征的多级特征向量序列,以及获取候选答案文本的具有上下文局部特征和句法结构特征的多级特征向量序列之前,该方法还包括:根据知识库问答文本语料构建专业问答词典;根据所述专业问答词典对所述问题文本和所述候选答案文本进行分析,得到所述问题文本的单词、所述问题文本的句法结构和所述候选答案文本的单词、所述候选答案文本的句法结构;对所述问题文本的单词、所述问题文本的句法结构和所述候选答案文本的单词、所述候选答案文本的句法结构分别进行分布式表示,得到问题文本的词向量和句法结构向量组成的向量序列和候选答案文本的词向量和句法结构向量组成的向量序列。
在本发明的一些实施例中,基于前述方案,所述循环神经网络包括双向循环神经网络,所述双向循环神经网络中的循环神经网络包括基于长短时记忆LSTM和/或基于门控循环单元GRU的网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811563115.6/2.html,转载请声明来源钻瓜专利网。