[发明专利]基于2D-LSTM的文本蕴含识别方法在审
申请号: | 202110210878.8 | 申请日: | 2021-02-25 |
公开(公告)号: | CN112883708A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 张宇;蒋润宇;施琦;齐乐 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/284;G06K9/62;G06N3/04;G06N5/04 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 刘景祥 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 lstm 文本 蕴含 识别 方法 | ||
1.基于2D-LSTM的文本蕴含识别方法,其特征在于,所述文本蕴含识别方法包括以下步骤:
步骤一、选择两个句子,利用按照两个句子的长短构建一个二维的大小为S*T的网格;
步骤二、从左到右、从上到下依次计算每个单元格的记忆向量;
步骤三、当计算到网格的右下角的单元格时,以把所述两个句子中的每个词与对方句子中的每个词进行两两比较,得到比较信息;
步骤四、在右下角的单元格中保存所述比较信息;
步骤五、利用所述比较信息建模两个句子之间的相似程度。
2.根据权利要求1所述的基于2D-LSTM的文本蕴含识别方法,其特征在于,在步骤一中,句子S和句子T的每个词对应网格的每一行和每一列。
3.根据权利要求1所述的基于2D-LSTM的文本蕴含识别方法,其特征在于,在步骤二中,网格中的每个单元格输入为:h1,h2,m1,m2,每个单元格的输出为h′1,h′2,m′1,m′2,其中h表示该单元格的隐藏向量hidden vectors,m表示该单元格的记忆向量memory vectors,下标中的1与2,在输入时,表示其指向当前单元格的上方和左方,在输出时,表示其指向当前单元格的下方和右方,计算方式为:
其中,函数LSTM(·,·,·)为一维长短时记忆网络的计算函数,w1,w2分别为横向和纵向的一维长短时记忆网络的网络参数,LSTM模型详细计算方式如下:
其中,gf代表LSTM模型中的遗忘门没遗忘当前状态的比例,gu代表记忆门记住新的输入的比例,gcgo代表输出门对当前状态的转化输出,m’与h’即为全新的记忆向量与隐藏向量。
4.根据权利要求1所述的基于2D-LSTM的文本蕴含识别方法,其特征在于,在步骤三至步骤五中,具体的,从左向右、从上向下依次遍历所有二维网格中的所有单元格,得到右下角的网格的输出向量hfinal,通过公式(3)计算问句S和T的相似度:
sim(s,t)=σ(wfinalhfinal+b) (3)
上述公式中出现的
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110210878.8/1.html,转载请声明来源钻瓜专利网。