[发明专利]机器阅读理解方法、装置、计算机设备和存储介质有效
申请号: | 202110692029.0 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113420134B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 傅欣雨 | 申请(专利权)人: | 康键信息技术(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/205;G06F40/279 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 黄恕 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 阅读 理解 方法 装置 计算机 设备 存储 介质 | ||
1.一种机器阅读理解方法,所述方法包括:
获取待处理问题以及所述待处理问题对应的备选答案;
在预设数据库内查找所述备选答案对应的摘要信息,将所述摘要信息拼接,获取摘要块,所述摘要信息为所述预设数据库中所述待处理问题相关的资料信息在存储时总结的摘要信息,所述备选答案对应的摘要信息为包含所有备选答案的摘要信息,所述将所述摘要信息拼接为将包含所有备选答案的所有摘要信息拼接;
将所述待处理问题以及所述摘要块输入预设问答网络模型,通过所述预设问答网络模型获取所述待处理问题对应答案字段的起止位置;
根据所述答案字段的起止位置,获取答案字段;
根据所述答案字段以及所述待处理问题对应的备选答案,获取所述待处理问题对应的预测答案;
所述预设问答网络模型包括嵌入层、自注意力层、encoder层以及concat层;
所述通过所述预设问答网络模型获取所述待处理问题对应答案字段的起止位置包括:
通过所述嵌入层对所述待处理问题以及所述摘要块进行词向量化处理;
通过所述自注意力层对词向量化处理后的所述待处理问题以及所述摘要块的关联关系进行学习和理解,获取关联特征;
通过所述encoder层对所述关联特征进行解析和编码,获取编码结果;
通过所述concat层对所述编码结果进行串联,获取编码串联结果;
基于线性回归和预设问答网络模型的softmax函数对所述编码串联结果进行处理,获取待处理问题对应答案字段的起止位置。
2.根据权利要求1所述的方法,其特征在于,在预设数据库内查找所述备选答案对应的摘要信息包括:
当在预设数据库内无法查找到所述备选答案对应的摘要信息时,提取所述备选答案中的关键词;
通过所述关键词在所述预设数据库内查找所述备选答案对应的摘要信息。
3.根据权利要求1所述的方法,其特征在于,所述待处理问题包括完形填空类问题。
4.根据权利要求1所述的方法,其特征在于,所述基于线性回归和预设问答网络模型的softmax函数对所述编码串联结果进行处理,获取待处理问题对应答案字段的起止位置包括:
基于线性回归和预设问答网络模型的softmax函数对所述编码串联结果进行处理,获取所述摘要块中每个位置对应的答案字段起始点概率以及答案字段终止点概率;
根据所述摘要块中每个位置对应的答案字段起始点概率以及答案字段终止点概率;
获取所述待处理问题对应答案字段的起止位置。
5.根据权利要求1所述的方法,其特征在于,所述将所述待处理问题以及所述摘要块输入预设问答网络模型,通过所述预设问答网络模型获取所述待处理问题对应答案字段的起止位置之前,还包括:
获取模型训练集数据以及模型测试集数据;
通过所述模型训练集数据对初始问答网络模型进行训练,通过所述模型测试集数据对训练完成的初始问答网络模型进行测试;
将通过测试的初始问答网络模型作为预设问答网络模型。
6.根据权利要求1所述的方法,其特征在于,所述根据所述答案字段以及所述待处理问题对应的备选答案,获取所述待处理问题对应的预测答案包括:
根据所述答案字段以及所述待处理问题对应的备选答案,通过分层匹配从所述备选答案中获取所述待处理问题对应的预测答案。
7.根据权利要求6所述的方法,其特征在于,所述根据所述答案字段以及所述待处理问题对应的备选答案,通过分层匹配从所述备选答案中获取所述待处理问题对应的预测答案包括:
通过完全匹配的形式基于答案字段对所述备选答案进行扫描;
当得到完全匹配的字段时,将所述完全匹配的字段对应备选答案作为预测答案;
当无法得到完全匹配的字段时,通过包含匹配的形式基于答案字段对所述备选答案进行扫描,当得到包含匹配的字段时,将所述包含匹配的字段对应备选答案作为预测答案;
当无法得到包含匹配的字段时,获取所述答案字段与所述备选答案的余弦相似度,根据所述余弦相似度获取所述待处理问题对应的预测答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康键信息技术(深圳)有限公司,未经康键信息技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110692029.0/1.html,转载请声明来源钻瓜专利网。