[发明专利]基于双向长短期记忆网络的文本交叉组合分类方法有效

申请号：	201810489619.1	申请日：	2018-05-21
公开（公告）号：	CN108829737B	公开（公告）日：	2021-11-05
发明（设计）人：	卢晨;张森林	申请（专利权）人：	浙江大学
主分类号：	G06F16/35	分类号：	G06F16/35;G06F40/289;G06N3/02
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	傅朝栋;张法高
地址：	310058 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于双向长短期记忆网络的文本交叉组合分类方法，属于自然语言处理领域。方法步骤如下：S1：构建用于对两个文本蕴含关系进行分类的深度神经网络模型，在该模型中先对对待比较蕴含关系的前提文本和假设文本进行分词，将词表征为实数值词向量；然后将实数值词向量分别输入双向长短期记忆循环网络中，分别输出表征文本特征的句向量；把两个句向量分别正向和反向连接得到两个组合向量，然后构建可以表征两文本差异的混合向量并输入分类器；S2：将带标签的语料库送入该模型进行训练。本发明使用双向长短期记忆循环网络提取文本上下文特征，借助交叉组合的方法来表征两文本间的差异，能够确定输入自然语言长文本与目标文本的关系。
搜索关键词：	基于双向短期记忆网络文本交叉组合分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于双向长短期记忆网络的文本交叉组合分类方法，用于比较两个文本的蕴含关系，其特征在于，步骤如下：S1：构建用于对两个文本蕴含关系进行分类的深度神经网络模型，在该模型中分类方法如下：S11：对待比较蕴含关系的前提文本和假设文本进行分词，选择向量转化模型将词表征为实数值词向量；S12：然后将S11中前提文本和假设文本的实数值词向量分别输入双向长短期记忆循环网络中，分别输出表征文本特征的句向量；S13：然后把两个句向量分别正向和反向连接得到两个组合向量，将前提向量、假设向量、两个组合向量之差、两个组合向量之积连接得到可以表征两文本差异的混合向量；S14：最后将所述的混合向量输入分类器，对待比较的两个文本间的蕴含关系进行分类；S2：将带标签的语料库送入该深度神经网络模型进行训练，训练完成后将该模型用于对文本蕴含关系进行分类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810489619.1/，转载请声明来源钻瓜专利网。

上一篇：一种图片数据和标签信息的拼接方法和系统
下一篇：一种ceph中数据存储方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于双向长短期记忆网络的文本交叉组合分类方法有效

专利文献下载