[发明专利]基于增强方式融合语法信息的深度学习文本匹配方法在审
申请号: | 202210384575.2 | 申请日: | 2022-04-13 |
公开(公告)号: | CN115034202A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 申奥运;张鹏;吴斌;张烁;张伟;严文龙 | 申请(专利权)人: | 天津大学;起硕(天津)智能科技有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/253;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 韩帅 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 增强 方式 融合 语法 信息 深度 学习 文本 匹配 方法 | ||
1.基于增强方式融合语法信息的深度学习文本匹配方法,所述文本匹配方法建立在编码层、匹配融合层和池化预测层;其特征在于:
所述编码层用于在句对编码表示时,对句子做依存句法分析,构造依存句法树,利用深度神经网络提取出句子的依存句法信息和语义信息,将两者相加融合;
所述匹配融合层用于在相似度计算时,计算句对之间编码特征的欧式距离,将内积交互矩阵与欧式距离矩阵两者对应位置相减,利用欧式距离增强内积交互过程;
所述池化预测层用于加权的池化方式与最大池化方式相拼接组合的池化模块进行信息的池化特征提取。
2.根据权利要求1所述的基于增强方式融合语法信息的深度学习文本匹配方法,其特征在于:所述编码层将对句对的编码表示进行语法信息的增强过程:
对预训练词向量嵌入;
应用BiLSTM抽取句子的上下文语义表示信息,如下式所示:
对句对进行依存句法树构建,应用TreeLSTM提取出句子的依存句法信息,将句子的依存句法信息与语义信息进行融合,如下式所示:
其中:和分别是pi(qj)左子树和右子树的隐藏层单元的输出,之后句子的表示将会被转换和为
3.根据权利要求1所述的基于增强方式融合语法信息的深度学习文本匹配方法,其特征在于:所述匹配融合层对文本之间的相似度计算时做语法信息的增强过程:
对编码信息计算向量内积式交互矩阵和欧式距离交互矩阵;
将两者对应位置相减获得增强后的交互矩阵,再做句对之间的相互表示;
将向表示信息与原始编码信息进行融合;
将融合后的特征使用BilSTM进行聚合。
4.根据权利要求1所述的基于增强方式融合语法信息的深度学习文本匹配方法,其特征在于:所述池化预测层对语法信息增强过程:
通过下式对语义特征权重归一化处理获得池化特征;
通过下式对池化特征信息进行拼接获得最大池化特征;
对所有的池化特征进行拼接获得最终的池化特征V;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学;起硕(天津)智能科技有限公司,未经天津大学;起硕(天津)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210384575.2/1.html,转载请声明来源钻瓜专利网。