[发明专利]基于增强方式融合语法信息的深度学习文本匹配方法在审

专利信息
申请号: 202210384575.2 申请日: 2022-04-13
公开(公告)号: CN115034202A 公开(公告)日: 2022-09-09
发明(设计)人: 申奥运;张鹏;吴斌;张烁;张伟;严文龙 申请(专利权)人: 天津大学;起硕(天津)智能科技有限公司
主分类号: G06F40/211 分类号: G06F40/211;G06F40/253;G06F40/30;G06N3/04;G06N3/08
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 韩帅
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 增强 方式 融合 语法 信息 深度 学习 文本 匹配 方法
【权利要求书】:

1.基于增强方式融合语法信息的深度学习文本匹配方法,所述文本匹配方法建立在编码层、匹配融合层和池化预测层;其特征在于:

所述编码层用于在句对编码表示时,对句子做依存句法分析,构造依存句法树,利用深度神经网络提取出句子的依存句法信息和语义信息,将两者相加融合;

所述匹配融合层用于在相似度计算时,计算句对之间编码特征的欧式距离,将内积交互矩阵与欧式距离矩阵两者对应位置相减,利用欧式距离增强内积交互过程;

所述池化预测层用于加权的池化方式与最大池化方式相拼接组合的池化模块进行信息的池化特征提取。

2.根据权利要求1所述的基于增强方式融合语法信息的深度学习文本匹配方法,其特征在于:所述编码层将对句对的编码表示进行语法信息的增强过程:

对预训练词向量嵌入;

应用BiLSTM抽取句子的上下文语义表示信息,如下式所示:

对句对进行依存句法树构建,应用TreeLSTM提取出句子的依存句法信息,将句子的依存句法信息与语义信息进行融合,如下式所示:

其中:和分别是pi(qj)左子树和右子树的隐藏层单元的输出,之后句子的表示将会被转换和为

3.根据权利要求1所述的基于增强方式融合语法信息的深度学习文本匹配方法,其特征在于:所述匹配融合层对文本之间的相似度计算时做语法信息的增强过程:

对编码信息计算向量内积式交互矩阵和欧式距离交互矩阵;

将两者对应位置相减获得增强后的交互矩阵,再做句对之间的相互表示;

将向表示信息与原始编码信息进行融合;

将融合后的特征使用BilSTM进行聚合。

4.根据权利要求1所述的基于增强方式融合语法信息的深度学习文本匹配方法,其特征在于:所述池化预测层对语法信息增强过程:

通过下式对语义特征权重归一化处理获得池化特征;

通过下式对池化特征信息进行拼接获得最大池化特征;

对所有的池化特征进行拼接获得最终的池化特征V;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学;起硕(天津)智能科技有限公司,未经天津大学;起硕(天津)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210384575.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top