[发明专利]一种机器阅读理解方法、装置、设备及存储介质有效
申请号: | 201910028548.X | 申请日: | 2019-01-11 |
公开(公告)号: | CN109753661B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 蔡世清;江建军;郑凯;段立新;王亚松 | 申请(专利权)人: | 国信优易数据股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/33;G06F16/35 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 唐维虎 |
地址: | 100000 北京市丰台区南四环*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器 阅读 理解 方法 装置 设备 存储 介质 | ||
1.一种机器阅读理解方法,其特征在于,包括:
将问题的语义信息编码至相应的原文中,得到所述原文对应的综合表示矩阵;以及,
针对原文中的每个原文分词,确定该原文分词以及位于该原文分词之后的相邻设定数目个原文分词,作为该原文分词对应的候选分词;
针对该原文分词对应的每个候选分词,基于所述原文对应的综合表示矩阵,确定该原文分词为所述问题的答案起点且该候选分词为所述问题的答案终点的概率,并将该概率作为分词组对应的答案边界概率,其中,所述问题为针对所述原文的问题,所述分词组包括该原文分词以及该候选分词;
基于所述原文对应的综合表示矩阵,确定该原文分词至该候选分词对应的原文片段为所述问题的答案内容的概率,并将该概率作为所述分词组对应的答案内容概率;
根据得到的各个分词组对应的答案边界概率以及各个分词组对应的答案内容概率,确定所述问题的答案;
其中,所述确定该原文分词至该候选分词对应的原文片段为所述问题的答案内容的概率,包括:
将所述综合表示矩阵输入到第三BiGRU模型中,得到第三表示矩阵;
将所述第三表示矩阵输入到第四BiGRU模型中,得到第四表示矩阵;
将所述第三表示矩阵、所述第四表示矩阵和所述综合表示矩阵均输入到第三线性分类器中,得到该原文分词至该候选分词对应的原文片段中每个原文分词为所述问题的答案内容的概率;
根据该原文分词至该候选分词对应的原文片段中各个原文分词为所述问题的答案内容的概率的乘积,确定该原文分词至该候选分词对应的原文片段为所述问题答案内容的概率。
2.根据权利要求1所述的机器阅读理解方法,其特征在于,确定所述问题的答案,具体包括:
确定各个分词组对应的答案边界概率与相应分词组对应的答案内容概率的乘积;
将对应乘积最大的分词组中的原文分词至候选分词对应的原文片段,确定为所述问题的答案。
3.根据权利要求1所述的机器阅读理解方法,其特征在于,确定该原文分词为所述问题的答案起点且该候选分词为所述问题的答案终点的概率,具体包括:
将所述综合表示矩阵输入到第一双向门控循环单元BiGRU模型中,得到第一表示矩阵;
将所述第一表示矩阵输入到第二BiGRU模型中,得到第二表示矩阵;
将所述第一表示矩阵和所述综合表示矩阵均输入到第一线性分类器中,得到该原文分词为所述问题的答案起点的概率;
将所述第二表示矩阵和所述综合表示矩阵均输入到第二线性分类器中,得到该候选分词为所述问题的答案终点的概率;
根据该原文分词为所述问题的答案起点的概率与该候选分词为所述问题的答案终点的概率的乘积,确定该原文分词为所述问题的答案起点且该候选分词为所述问题的答案终点的概率。
4.根据权利要求1-3任一项所述的机器阅读理解方法,其特征在于,将问题的语义信息编码至相应的原文中,得到所述原文对应的综合表示矩阵,具体包括:
基于所述原文中各原文分词对应的分词特征向量,确定所述原文对应的原文分词特征矩阵,以及,基于所述问题中各问题分词对应的分词特征向量,确定所述问题对应的问题分词特征矩阵;其中,所述分词特征向量由相应分词对应的语义特征向量、词性标注特征向量以及命名实体特征向量拼接得到;
基于所述原文对应的原文分词特征矩阵以及所述问题对应的问题分词特征矩阵,确定所述原文对应的综合表示矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信优易数据股份有限公司,未经国信优易数据股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910028548.X/1.html,转载请声明来源钻瓜专利网。