[发明专利]机器阅读理解方法、装置、计算机设备和存储介质有效
申请号: | 202110692029.0 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113420134B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 傅欣雨 | 申请(专利权)人: | 康键信息技术(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/205;G06F40/279 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 黄恕 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 阅读 理解 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及人工智能领域的自然语言处理领域,具体涉及一种机器阅读理解方法、装置、计算机设备和存储介质。方法通过获取待处理问题以及待处理问题对应的备选答案;在预设数据库内查找备选答案对应的摘要信息,将摘要信息拼接,获取摘要块;将待处理问题以及摘要块输入预设问答网络模型,获取待处理问题对应答案字段的起止位置;获取答案字段,从而获取待处理问题对应的预测答案。通过将备选答案对应的摘要信息拼接,而后通过预设问答网络模型来预测答案字段的起止位置,从而迅速地根据答案字段的起止位置从备选答案中挑选出最终预测的答案选项,无需分别计算每个备选答案的置信度,从而有效提高机器阅读理解处理效率。
技术领域
本申请涉及人工智能领域,特别是涉及一种机器阅读理解方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术与人工智能技术的发展,出现了机器阅读理解(Machine ReadingComprehension,MRC)技术。是一种利用算法使计算机理解文章语义并回答相关问题的技术。由于文章和问题均采用人类语言的形式,因此机器阅读理解属于自然语言处理(NLP)的范畴,也是其中最新最热门的课题之一。近些年来,随着机器学习,特别是深度学习的发展,机器阅读理解研究有了长足的进步,并在实际应用中崭露头角。
目前,在基于机器阅读理解的问答机器人领域,例如在临床医学资格考试的问答机器人领域,可以通过输入大量的辅助阅读材料和知识文本,而后通过复杂的multi-layerreasoning(多层推理)来获得每个问题选项的置信值,从而确定正确的问题选项。然而这种方法的计算过程较为复杂,进行机器阅读理解的处理效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能提高机器阅读理解处理效率的机器阅读理解方法、装置、计算机设备和存储介质。
一种机器阅读理解方法,所述方法包括:
获取待处理问题以及所述待处理问题对应的备选答案;
在预设数据库内查找所述备选答案对应的摘要信息,将所述摘要信息拼接,获取摘要块;
将所述待处理问题以及所述摘要块输入预设问答网络模型,通过所述预设问答网络模型获取所述待处理问题对应答案字段的起止位置;
根据所述答案字段的起止位置,获取答案字段;
根据所述答案字段以及所述待处理问题对应的备选答案,获取所述待处理问题对应的预测答案。
在其中一个实施例中,所述在预设数据库内查找所述备选答案对应的摘要信息还包括:
当在预设数据库内无法查找到所述备选答案对应的摘要信息时,提取所述备选答案中的关键词;
通过所述关键词在所述预设数据库内查找所述备选答案对应的摘要信息。
在其中一个实施例中,所述预设问答网络模型包括嵌入层、自注意力层、 encoder层以及concat层,所述通过所述预设问答网络模型获取所述待处理问题对应答案字段的起止位置包括:
通过所述嵌入层对词向量化处理后的所述待处理问题以及所述摘要块进行词向量化处理;
通过所述自注意力层对所述待处理问题以及所述摘要块的关联关系进行学习和理解,获取关联特征;
通过所述encoder层对所述关联特征进行解析和编码,获取编码结果;
通过所述concat层对所述编码结果进行串联,获取编码串联结果;
基于线性回归和预设问答网络模型的softmax函数对所述编码串联结果进行处理,获取待处理问题对应答案字段的起止位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康键信息技术(深圳)有限公司,未经康键信息技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110692029.0/2.html,转载请声明来源钻瓜专利网。