[发明专利]智能机器阅读理解方法、装置、电子设备及存储介质在审
申请号: | 202110257925.4 | 申请日: | 2021-03-10 |
公开(公告)号: | CN112632265A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 刘磊 | 申请(专利权)人: | 北京沃丰时代数据科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/30;G06K9/62;G06N20/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王宇杨 |
地址: | 100160 北京市丰台区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 机器 阅读 理解 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供了一种智能机器阅读理解方法、装置、电子设备及存储介质。其中,智能机器阅读理解方法,包括:获取待检问题;通过深度语义匹配的方式,从预设的问题答案优选集中匹配所述待检问题的答案;如果匹配到所述答案,则将所述答案作为最终答案,否则通过预先训练好的阅读理解模型,获得所述待检问题的最终答案,其中,所述预先训练好的阅读理解模型包括BERT模型和QANet模型。本发明的实施例,可以有效地提升智能机器阅读理解结果的准确性和可靠性。
技术领域
本发明涉及智能机器阅读理解技术领域,尤其涉及一种智能机器阅读理解方法、装置、电子设备及存储介质。
背景技术
现有的机器阅读理解技术都是基于特定数据集的处理方法,主要有三种代表方法:一种是基于传统特征的方法,通过选取不同的特征,然后基于选取的特征构造并学习一个三元打分函数,将得分最高的候选答案a作为问题q在文档d中的答案;第二种是基于神经网络的方法;第三种是基于深层语义的图匹配方法。其中,基于传统特征的方法由于特征本身所具有的局限性,很难处理复述以及远距离依赖问题。基于神经网络的方法对于某些需要引入外部知识进行更深层次推理、几乎不可能仅仅通过相似度匹配得到结果的任务则无能为力。基于深层语义的图匹配方法由于对于外部知识的依赖性较强,因此适用范围较窄,可拓展性较弱。
发明内容
针对现有技术中的问题,本发明实施例提供一种智能机器阅读理解方法、装置、电子设备及存储介质。
具体地,本发明实施例提供了以下技术方案:
第一方面,本发明实施例提供了一种智能机器阅读理解方法,包括:
获取待检问题;
通过深度语义匹配的方式,从预设的问题答案优选集中匹配所述待检问题的答案;
如果匹配到所述答案,则将所述答案作为最终答案,否则通过预先训练好的阅读理解模型,获得所述待检问题的最终答案,其中,所述预先训练好的阅读理解模型包括BERT模型和QANet模型。
进一步地,所述如果匹配到所述答案,则将所述答案作为最终答案,包括:
从所述问题答案优选集和所述待检问题进行深度语义匹配,并判断匹配结果中是否存在匹配度超过预设阈值的结果;
如果有,则将匹配度超过预设阈值的结果作为所述最终答案。
进一步地,在通过预先训练好的阅读理解模型,获得所述待检问题的最终答案之前,包括:对所述阅读理解模型进行训练。
进一步地,所述对所述阅读理解模型进行训练,包括:
对文档集以及问答对集进行切分,得到问题集以及候选答案片段集;
通过BERT模型预测答案起始位置和终止位置,并预测答案与真实答案的评测差异;
基于所述评测差异对所述BERT模型进行二次训练,得到训练好的BERT模型。
进一步地,通过预先训练好的阅读理解模型,获得所述待检问题的最终答案,包括:
获得所述BERT模型的预测答案,获得所述QANet模型的预测答案;
对所述BERT模型的预测答案和所述QANet模型的预测答案进行加权求和,得到所述最终答案。
进一步地,还包括:
获取最终答案的反馈信息,并根据反馈信息对所述阅读理解模型进行模型优化。
第二方面,本发明实施例还提供了一种智能机器阅读理解装置,包括:
获取模块,用于获取待检问题;
答案确定模块,用于通过深度语义匹配的方式,从预设的问题答案优选集中匹配所述待检问题的答案,如果匹配到所述答案,则将所述答案作为最终答案,否则通过预先训练好的阅读理解模型,获得所述待检问题的最终答案,其中,所述预先训练好的阅读理解模型包括BERT模型和QANet模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃丰时代数据科技有限公司,未经北京沃丰时代数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110257925.4/2.html,转载请声明来源钻瓜专利网。