[发明专利]一种生成式机器阅读理解方法、装置、设备及存储介质在审

专利信息
申请号: 201910914091.2 申请日: 2019-09-25
公开(公告)号: CN110750630A 公开(公告)日: 2020-02-04
发明(设计)人: 殷子墨;李健;张连毅;武卫东 申请(专利权)人: 北京捷通华声科技股份有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/383;G06F40/151;G06F17/16;G06Q40/02
代理公司: 11319 北京润泽恒知识产权代理有限公司 代理人: 莎日娜
地址: 100193 北京市海淀区东北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 向量矩阵 目标问题 中间结果 概率向量 概率预测 向量 拼接 自然语言理解技术 解码器 输入编码器 答案 存储介质 向量确定 关联度 契合度 生成式 预测 占位 文本 阅读 申请
【说明书】:

本申请提供了一种生成式机器阅读理解方法、装置、设备及存储介质,涉及自然语言理解技术领域。旨在提高生成答案与目标问题的契合度。所述方法包括:根据候选文章与所述目标问题的关联度,确定目标文章,将目标文章和目标问题的文章问题拼接向量矩阵输入编码器,得到中间结果向量矩阵,解码器根据中间结果向量矩阵和占位向量,得到第一个预测概率向量,再依次取n从1至N,结合中间结果向量矩阵和第n个预测概率向量,得到第n+1个概率预测向量,根据得到的第n+1个概率预测向量确定n+1个字,拼接第1至n+1个字,得到答案文本。

技术领域

本申请涉及自然语言理解技术领域,特别是涉及一种生成式机器阅读理解方法、装置、设备及存储介质。

背景技术

目前自然语言理解技术近年来被广泛应用于智能客服领域。以银行为例,银行拥有大量用户,并经常提出咨询问题。行方为了节约人力,非常期待以智能客服的形式为用户提供24小时的问题解答服务。

对于用户提出的问题,有很大可能在银行方的规章制度、培训手册、产品说明等文档中存在答案。机器阅读理解技术为此服务,通过读取文本,自动回答用户提出的问题,节约人力成本。

当前的机器阅读理解技术,绝大多数是以一篇原文档做抽取,从文章中找到某个词或字作为答案的起点,再从文章中找到某个词作为答案的终点,截取一个片段作为答案,返回给用户。这种回答方式生成的答案会包括多余冗杂的信息,或是漏掉一部分信息,进而出现与问题契合度较低的现象,显得过于僵硬,不能带来良好的用户体验。

发明内容

本申请实施例提供一种生成式机器阅读理解方法、装置、设备及存储介质,旨在得到与问题准确契合的答案。

本申请实施例第一方面提供一种生成式机器阅读理解方法,所述方法包括:

获得目标问题和候选文章;

将所述候选文章和所述目标问题分别转换为文章向量矩阵和问题向量矩阵;

将所述文章向量矩阵和所述问题向量矩阵的文章问题拼接向量矩阵输入预先训练的生成式机器阅读理解模型的编码器,得到中间结果向量矩阵和相关度分值,所述相关度分值表征所述候选文章与所述目标问题的关联度;

在所述候选文章与所述目标问题的关联度大于预设阈值的情况下,将所述候选文章确定为用于解答所述目标问题的目标文章,并将所述中间结果向量矩阵输入所述预先训练的生成式机器阅读理解模型的解码器,得到所述解码器输出的第一个预测概率向量;

根据所述第一个概率预测向量,确定所述目标问题的答案文本包括的第一个字;

依次取n从1至N,执行步骤:将所述第n个预测概率向量和所述中间结果向量矩阵输入所述解码器,得到所述解码器输出的第n+1个预测概率向量,根据所述第n+1个概率预测向量,确定所述目标问题的答案文本包括的第n+1个字,直到所述解码器输出结尾符概率向量为止;

将所述目标问题的答案文本包括的第1至n+1个字拼接,得到所述目标问题的答案文本。

所述方法还包括:获得多个文章正样本;

针对每个文章正样本,确定问题样本,该问题样本是基于该文章正样本能够解答的问题;

将所述多个文章正样本和问题样本分别转换为文章正样本向量矩阵和问题样本向量矩阵;

以多个文章正样本向量矩阵和问题样本向量矩阵的文章问题正样本拼接向量矩阵,为第一训练样本,对第一预设模型进行训练;

将经过多次训练后的第一预设模型确定为所述编码器。

所述方法还包括:获得多个文章负样本,所述问题样本基于每个文章负样本均不能解答;

将所述多个文章负样本分别转换为文章负样本向量矩阵;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910914091.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top