[发明专利]基于双向长短期记忆网络的文本交叉组合分类方法有效
申请号: | 201810489619.1 | 申请日: | 2018-05-21 |
公开(公告)号: | CN108829737B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 卢晨;张森林 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06N3/02 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 傅朝栋;张法高 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于双向长短期记忆网络的文本交叉组合分类方法,属于自然语言处理领域。方法步骤如下:S1:构建用于对两个文本蕴含关系进行分类的深度神经网络模型,在该模型中先对对待比较蕴含关系的前提文本和假设文本进行分词,将词表征为实数值词向量;然后将实数值词向量分别输入双向长短期记忆循环网络中,分别输出表征文本特征的句向量;把两个句向量分别正向和反向连接得到两个组合向量,然后构建可以表征两文本差异的混合向量并输入分类器;S2:将带标签的语料库送入该模型进行训练。本发明使用双向长短期记忆循环网络提取文本上下文特征,借助交叉组合的方法来表征两文本间的差异,能够确定输入自然语言长文本与目标文本的关系。 | ||
搜索关键词: | 基于 双向 短期 记忆 网络 文本 交叉 组合 分类 方法 | ||
【主权项】:
1.一种基于双向长短期记忆网络的文本交叉组合分类方法,用于比较两个文本的蕴含关系,其特征在于,步骤如下:S1:构建用于对两个文本蕴含关系进行分类的深度神经网络模型,在该模型中分类方法如下:S11:对待比较蕴含关系的前提文本和假设文本进行分词,选择向量转化模型将词表征为实数值词向量;S12:然后将S11中前提文本和假设文本的实数值词向量分别输入双向长短期记忆循环网络中,分别输出表征文本特征的句向量;S13:然后把两个句向量分别正向和反向连接得到两个组合向量,将前提向量、假设向量、两个组合向量之差、两个组合向量之积连接得到可以表征两文本差异的混合向量;S14:最后将所述的混合向量输入分类器,对待比较的两个文本间的蕴含关系进行分类;S2:将带标签的语料库送入该深度神经网络模型进行训练,训练完成后将该模型用于对文本蕴含关系进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810489619.1/,转载请声明来源钻瓜专利网。