[发明专利]一个基于深度神经网络及强化学习的生成式机器阅读理解方法有效
申请号: | 201810131702.1 | 申请日: | 2018-02-09 |
公开(公告)号: | CN108415977B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 朱国轩;王家兵 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289;G06F40/30;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一个基于深度神经网络及强化学习的生成式机器阅读理解方法,该方法通过结合注意力机制的深层神经网络来对文本和问题进行编码,形成融合了问题信息的文本向量表示之后,再通过单向LSTM解码器进行解码,逐步生成对应的答案文本。本发明公开的阅读理解方法融合了抽取式模型和生成式模型的优点,采用多任务联合优化的方式进行训练,训练过程中同时还使用了强化学习方法,有利于生成更加准确而流畅的答案文本。 | ||
搜索关键词: | 一个 基于 深度 神经网络 强化 学习 生成 机器 阅读 理解 方法 | ||
【主权项】:
1.一个基于深度神经网络及强化学习的生成式机器阅读理解方法,其特征在于,所述的生成式机器阅读理解方法包括下列步骤:S1、对文本及问题中的句子进行预处理,所述的预处理包括分词、词性标注、命名实体识别,将单词映射成词表当中对应的词向量,并与词性及命名实体类型的特征向量拼接在一起,形成文本和问题的初始特征向量表示;S2、将文本与问题的向量表示分别通过两个多层BiLSTM进行处理,将各层的正向及反向输出全部拼接在一起,从而学习到文本和问题浅层和深层特征表示的组合;S3、通过文档‑问题分层注意力机制将问题的向量表示融合到文本的向量表示当中去,然后再次通过BiLSTM对文本和问题进行编码,形成文本和问题的最终特征向量表示;S4、通过注意力机制,对问题中各单词的表示进行加权组合,形成一个与问题长度无关的向量,通过该向量与文本的最终向量表示做内积,抽取出文本当中能够用于回答问题的信息片段,再次通过注意力机制,对文本中的这些信息片段进行加权组合,形成一个与文本长度无关的向量,作为解码器的初始隐状态输入;S5、使用一个单向LSTM作为解码器,并以文本的最终特征向量表示作为其输入序列,按照序列到序列的方式逐个单词地生成对应的答案文本。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810131702.1/,转载请声明来源钻瓜专利网。