[发明专利]基于三维特征表示的智能文本阅读理解方法和装置在审

专利信息
申请号: 202210975837.2 申请日: 2022-08-15
公开(公告)号: CN115345173A 公开(公告)日: 2022-11-15
发明(设计)人: 鹿文鹏;邵珠峰;马凤英;郑超群;张维玉;乔新晓;于瑞 申请(专利权)人: 齐鲁工业大学
主分类号: G06F40/30 分类号: G06F40/30;G06N3/04;G06N3/08
代理公司: 济南信达专利事务所有限公司 37100 代理人: 孙园园
地址: 250353 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 三维 特征 表示 智能 文本 阅读 理解 方法 装置
【说明书】:

发明公开了基于三维特征表示的智能文本阅读理解方法及装置、存储介质、电子设备,属于自然语言处理、人工智能领域,本发明要解决的技术问题为如何捕获三序列数据之间的直接交互特征以及如何增强文章、问句和选项三者之间的充分交互,从而提高智能文本阅读理解系统的预测准确性,采用的技术方案为:①一种基于三维特征表示的智能文本阅读理解方法,包括如下模块:预训练嵌入表示模块、特征过滤模块、3D CNN交互特征模块和标签预测模块。②一种基于三维特征表示的智能文本阅读理解装置,包括:智能文本阅读理解数据集获取单元、智能文本阅读理解模型构建单元和智能文本阅读理解模型训练单元。

技术领域

本发明涉及人工智能、自然语言处理技术领域,具体涉及一种基于三维特征表示的智能文本阅读理解方法和装置。

背景技术

机器阅读理解是指计算机在给定的文章内容中,为相关问题找寻其对应的正确答案的一项任务。机器阅读理解是自然语言处理领域中最热门的研究课题之一,根据回答问题的方式不同,其可被分为四类子任务:填空式阅读理解、抽取式阅读理解、智能文本阅读理解和生成式阅读理解。智能文本阅读理解需要依赖给定的文章,针对问句提出的问题,在多个选项中选择出正确的答案。其中,选项的内容是由人类专家总结撰写而成,不会直接出现在原文中。因此,智能文本阅读理解任务要求计算机拥有强大的推理、类比和总结能力。该任务不仅需要计算问句与各个候选选项之间的匹配程度,而且还需要计算问句、选项与文章内容的之间的相关性,这是因为有些选项可能自身的表述并没有问题,也与当前问题相关性较高,但是其可能并不符合文章所规定的语境,所以,该选项不会是正确答案。由此可以看出,智能文本阅读理解是一个需要挖掘三者之间交互特征、计算三者之间相关性的任务,到目前为止,现有的方法并没有实质性地解决这一问题。

为了实现文章、问句和选项之间的特征交互,现有的大多数方法会将文章信息通过不同的方式融合到问句或选项中去,然后对问句和选项进行交互匹配,最终在多个选项中选择一个与该问句匹配度最高的选项作为正确答案。这类方法的优点是简洁并且易于实现,但是问题在于智能文本阅读理解本身是判断三个文本序列(即文章、问句、选项)间关系的任务,而以融合的方式来利用文章信息,除了融合过程导致的信息丢失外,还必然会导致序列间的交互不充分,从而降低阅读理解模型的准确率。

针对现有方法的弊端,本发明提出了一种基于三维特征表示的智能文本阅读理解方法和装置,其可以捕获三序列数据之间的直接交互特征,并且有效增强文章、问句和选项三者之间的充分交互,从而提高智能文本阅读理解系统的预测准确性。

发明内容

本发明的技术任务是提供基于三维特征表示的智能文本阅读理解方法及装置、存储介质、电子设备,来解决如何捕获三序列数据之间的直接交互特征以及如何增强文章、问句和选项三者之间的充分交互,从而提高智能文本阅读理解系统的预测准确性。

本发明的技术任务是按以下方式实现的,一种基于三维特征表示的智能文本阅读理解方法,该方法包括如下步骤:

S1、获取智能文本阅读理解数据集:从网络上下载已经公开的智能文本阅读理解数据集或者自行构建数据集;

S2、构建智能文本阅读理解模型:基于三维特征表示构建智能文本阅读理解模型;

S3、训练智能文本阅读理解模型:在步骤S1所得到智能文本阅读理解训练数据集上对步骤S2构建的智能文本阅读理解模型进行训练。

作为优选,所述步骤S2中构建智能文本阅读理解模型的具体步骤如下:

S201、构建输入模块

针对数据集中的每一条数据,将文章序列,记为context;将问句序列,记为query;将所有候选选项记为response;根据正确答案,确定该条数据的标签,即,若正确答案为A,则记为1000,若正确答案为B,则记为0100,若正确答案为C,则记为0010,若正确答案为D,则记为0001;三个文本序列与标签,共同组成一条输入数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210975837.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top