[发明专利]一种基于文本回答问题的方法及装置在审
申请号: | 201910995402.2 | 申请日: | 2019-10-18 |
公开(公告)号: | CN112685543A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 曹秀亭 | 申请(专利权)人: | 普天信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06N3/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张睿 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 回答 问题 方法 装置 | ||
1.一种基于文本回答问题的方法,其特征在于,包括:
输入问题语义信息和文本语义信息至预设问题回答模型,并根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数;其中,所述第一参数包含问题语义信息中的、与文本语义信息中的各词分别相关的语义信息、所述第二参数包含文本语义信息中的、与问题语义信息中的各词分别相关的语义信息;
根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数;
根据所述问题语义信息和所述上下文表征参数,在所述文本语义信息中输出回答问题的起始索引和终止索引。
2.根据权利要求1所述的基于文本回答问题的方法,其特征在于,所述根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数,包括:
根据问题语义信息和文本语义信息,确定相似度矩阵;所述相似度矩阵的行是与文本语义信息中的各词分别对应的问题语义信息中的全部词之间的相似度,所述相似度矩阵的列是与问题语义信息中的各词分别对应的文本语义信息中的全部词之间的相似度;
根据所述相似度矩阵、所述问题语义信息和所述分类器,确定所述第一参数,并根据所述相似度矩阵、所述文本语义信息和所述分类器,确定所述第二参数。
3.根据权利要求2所述的基于文本回答问题的方法,其特征在于,所述根据所述相似度矩阵、所述问题语义信息和所述分类器,确定所述第一参数,包括:根据如下公式确定所述第一参数:
U'=Σj(softmax(St:)*U:j)
其中,U'为所述第一参数、softmax为所述分类器、St:为所述相似度矩阵中第t行的所有数据、U:j为问题语义信息中第j列的所有数据。
4.根据权利要求2所述的基于文本回答问题的方法,其特征在于,所述根据所述相似度矩阵、所述文本语义信息和所述分类器,确定所述第二参数,包括:根据如下公式计算所述第二参数:
H'=Σt(softmax(max(S:j))*Ht:)
其中,H'为所述第二参数、softmax为所述分类器、max为求最大值函数、S:j为所述相似度矩阵中第j列的所有数据、Ht:为文本语义信息中第t行的所有数据。
5.根据权利要求1所述的基于文本回答问题的方法,其特征在于,所述根据所述第一参数、所述第二参数、所述文本语义信息和所述预设问题回答模型中的全连接网络,确定可感知问题的上下文表征参数,包括,根据如下拼接方式确定所述上下文表征参数:
G=β(H;U';H*U';H*H')
其中,G为所述上下文表征参数、β为所述全连接网络、H为所述文本语义信息、U'为所述第一参数、所述H'为所述第二参数。
6.根据权利要求1至5任一所述的基于文本回答问题的方法,其特征在于,所述输入问题语义信息和文本语义信息至预设问题回答模型的步骤之后,所述基于文本回答问题的方法还包括:
对所述文本语义信息和所述问题语义信息分别进行编码处理;
用编码处理后的文本语义信息和编码处理后的问题语义信息替换所述根据问题语义信息、文本语义信息和所述预设问题回答模型中的分类器,确定与文本语义信息中的各词分别对应的第一参数、及与问题语义信息中的各词分别对应的第二参数步骤中的问题语义信息和文本语义信息,并执行后续步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普天信息技术有限公司,未经普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910995402.2/1.html,转载请声明来源钻瓜专利网。