[发明专利]一种基于文本段落时序信息的机器阅读理解方法在审

专利信息
申请号: 202210592123.3 申请日: 2022-05-28
公开(公告)号: CN114925172A 公开(公告)日: 2022-08-19
发明(设计)人: 杨路明;彭涛 申请(专利权)人: 武汉纺织大学
主分类号: G06F16/33 分类号: G06F16/33;G06K9/62;G06N3/04
代理公司: 泰州中盾专利代理事务所(普通合伙) 32580 代理人: 季亚锋
地址: 430000 *** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 文本 段落 时序 信息 机器 阅读 理解 方法
【说明书】:

发明提供了一种基于文本段落时序信息的机器阅读理解方法,属于自然语言处理中的阅读理解技术领域。解决了时序信息获取不充分的问题,提出一种基于文本段落时序信息的机器阅读理解方法。一种基于文本段落时序信息的机器阅读理解方法,包括S1、采用了BERT‑base模型获得较为准确的词向量特征表示;S2、使用时间卷积网络提取文本时序特征,时间卷积网络包括因果空洞卷积和残差连接,因果空洞卷积可以很好的提取文本时序特征,残差连接防止可能会引起的梯度消失等问题等优点;S3、使用双向长短时记忆网络实现分段间的信息传递。本发明具有解决了时序信息获取不充分的问题;可以在不同分段之间传递信息,整合文本上下文信息。

技术领域

本发明属于自然语言处理中的阅读理解技术领域,涉及一种基于文本段落时序信息的机器阅读理解方法。

背景技术

使用预训练模型解决机器阅读理解问题已经成为一种趋势。但例如BERT这样的模型通常由一些只允许固定长度输入的transformer层组成。但是,一些阅读理解数据集比如对话类数据集,通常会超出长度限制,因为实际情况下可能需要将对话过程中先前提出的问题、当前的问题以及相对应的文档合并到输入中才能回答当前的问题。

由于BERT采用固定长度的文本作为输入,对于那些超出长度的输入,通常将它们分成等距的段,并根据每个分段独立地预测答案,而不考虑其他分段的信息。但这样便无法整合不同分段间的时序信息,无法回答需要跨句段获取信息的问题。

针对时序信息获取不充分的问题,提出一种基于文本段落时序信息的机器阅读理解方法,该方法在预训练语言模型BERT的基础上融合了文字的时序位置信息与文档分段间的时序信息,并使用时间卷积网络提取更加丰富的时序信息。

发明内容

本发明的目的是针对现有的技术存在的上述问题,提供一种基于文本段落时序信息的机器阅读理解方法,本发明所要解决的技术问题是在预训练语言模型BERT的基础上使用文字的时序位置信息与文档分段间的时序信息,并使用时间卷积网络提取更加丰富的时序信息,解决时序信息无法利用的问题。

本发明的目的可通过下列技术方案来实现:一种基于文本段落时序信息的阅读理解方法,其特征在于:

S1、使用预训练语言模型BERT获得较为准确的词向量特征表示;

S2、使用时序信息提取模块获取文本时序特征;

S3、针对不同的分段,通过信息传递交互模块实现分段间的时序信息交互;

S4、利用答案预测模块输出答案。

预训练语言模型BERT采用了BERT-base模型获得较为准确的词向量特征表示,而BERT中的位置编码机制有利于获取细粒度的文字时序位置信息。

首先对问题和文档分段进行分词处理,即将句子转为词级别的序列,之后按照BERT的输入格式输入。如果问题+文档片段的长度大于BERT规定的最大长度,将以一定的步长分割为若干段,分别和问题连接;

时序信息提取模块使用时间卷积网络提取文本时序特征,在本发明中时间卷积网络的输入是问题和文章的词向量表示,每一层使用1维空洞卷积网络,每层之间采用残差的方法连接。卷积核大小为3,输出根据当前状态,以及之前的时间步的状态决定。此外,时间卷积网络中的残差连接使得网络可以以跨层的方式传递信息,也能预防可能会引起的梯度消失等问题。

信息传递交互模块使用双向长短时记忆网络实现分段间的信息传递,在本发明中使用双向长短时记忆网络BiLSTM作为信息传递机制。

答案预测模块将文章中的一个跨度提取出作为答案具体的,对文章中的每个词进行评估,预测其为答案开始位置以及答案结束位置的概率。

与现有技术相比,本发明具有以下优点:

1、解决了时序信息获取不充分的问题;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉纺织大学,未经武汉纺织大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210592123.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top