[发明专利]基于深层递进匹配的选择式机器阅读理解方法及系统在审
申请号: | 202211555163.7 | 申请日: | 2022-12-06 |
公开(公告)号: | CN115936004A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 邹杰 | 申请(专利权)人: | 山东艺术学院 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250013 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深层 递进 匹配 选择 机器 阅读 理解 方法 系统 | ||
本发明公开了基于深层递进匹配的选择式机器阅读理解方法及系统,属于人工智能及自然语言处理技术领域,本发明要解决的技术问题为如何有效挖掘文章中的语义信息和问句中的关键信息以及如何增强文章中的语义信息和问句中的关键信息与选项之间的深层语义交互,提高选择式机器阅读理解预测的准确性,采用的技术方案为:该方法具体如下:获取选择式机器阅读理解数据集:从网络上下载已经公开的选择式机器阅读理解数据集或自行构建选择式机器阅读理解数据集;构建选择式机器阅读理解模型:基于深层递进匹配构建选择式机器阅读理解模型;训练选择式机器阅读理解模型:在选择式机器阅读理解数据集上对选择式机器阅读理解模型进行训练。
技术领域
本发明涉及人工智能及自然语言处理技术领域,具体地说是一种基于深层递进匹配的选择式机器阅读理解方法及系统。
背景技术
机器阅读理解任务是一项用于评估计算机理解自然语言程度的任务,对促进自然语言理解技术的发展具有非常重要的意义。机器阅读理解任务需要在给定文本内容的情况下,充分理解文本和问句的语义信息,然后根据不同的任务要求,给出特定形式的答案。根据答案的形式不同,机器阅读理解任务可细分为生成式、选择式、抽取式和填空式。其中,选择式机器阅读理解任务的答案是人类专家总结归纳而成,以选项的形式给出,因此,候选选项的内容不会出现在原文中,这对模型的推理能力提出了更高的要求。
与自动问答任务相比而言,选择式阅读理解任务是被要求在给定的语境下回答相应的问题,但是,其核心问题仍是问句和选项间的语义匹配。人类在做选择式阅读理解任务时,往往是带着问题读原文,然后根据不同的选项对文章内容进行层层递进的分析和理解。现有方法往往是对文章、问句和选项进行编码后,根据最终的编码结果进行交互和匹配,这显然是不合理的。
故如何有效挖掘文章中的语义信息和问句中的关键信息以及如何增强文章中的语义信息和问句中的关键信息与选项之间的深层语义交互,提高选择式机器阅读理解预测的准确性是目前亟待解决的技术问题。
发明内容
本发明的技术任务是提供一种基于深层递进匹配的选择式机器阅读理解方法及系统,来解决如何有效挖掘文章中的语义信息和问句中的关键信息以及如何增强文章中的语义信息和问句中的关键信息与选项之间的深层语义交互,提高选择式机器阅读理解预测的准确性的问题。
本发明的技术任务是按以下方式实现的,一种基于深层递进匹配的选择式机器阅读理解方法,该方法具体如下:
获取选择式机器阅读理解数据集:从网络上下载已经公开的选择式机器阅读理解数据集或自行构建选择式机器阅读理解数据集;
构建选择式机器阅读理解模型:基于深层递进匹配构建选择式机器阅读理解模型;
训练选择式机器阅读理解模型:在选择式机器阅读理解数据集上对选择式机器阅读理解模型进行训练。
作为优选,构建选择式机器阅读理解模型具体如下:
构建输入数据:针对数据集中的每一条数据,将文章序列记为passage;将问句序列记为question;将所有候选选项序列记为response;根据正确答案,确定该条数据的标签,即,若正确答案为A,则记为1000,若正确答案为B,则记为0100,若正确答案为C,则记为0010,若正确答案为D,则记为0001;文章序列、问句序列和候选选项序列与标签共同组成一条输入数据;
构建预训练嵌入表示:使用预训练语言模型BERT对输入数据进行嵌入处理,从而得到文章嵌入特征表示问句嵌入特征表示和选项嵌入特征表示公式如下:
其中,passage表示文章序列;question表示问句序列;response表示选项序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东艺术学院,未经山东艺术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211555163.7/2.html,转载请声明来源钻瓜专利网。