[发明专利]一种指代消解文本的生成方法、装置及电子设备有效
申请号: | 202010467473.8 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111401036B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 梁忠平;温祖杰 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289;G06N3/08;G06N3/04 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 王刚 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 指代 消解 文本 生成 方法 装置 电子设备 | ||
1.一种指代消解文本的生成方法,包括:
获取用户的历史对话文本和所述用户的当前输入文本;
将所述历史对话文本和所述当前输入文本输入预先训练的指代消解文本生成模型,以使所述指代消解文本生成模型生成对应于所述当前输入文本的指代消解文本;所述指代消解文本包括由所述指代消解文本生成模型逐步输出的若干输出词;所述指代消解文本生成模型包括第一编码器、第二编码器、第一输入层、第二输入层和解码器;
所述指代消解文本生成模型在每一步输出的输出词是根据所述第一编码器基于自注意力机制为所述历史对话文本中的各个词生成的第一自注意力特征、所述第二编码器基于自注意力机制为所述当前输入文本中的各个词生成的第二自注意力特征以及所述解码器基于自注意力机制在当前步生成的第三自注意力特征来确定的;
其中,将所述历史对话文本输入所述第一输入层,以使所述第一输入层生成所述历史对话文本中的各个词的第一词向量;将所述第一词向量输入所述第一编码器,以使所述第一编码器为所述历史对话文本中的各个词生成第一隐状态,并基于自注意力机制,根据所述第一隐状态为所述历史对话文本中的各个词生成所述第一自注意力特征;
将所述当前输入文本输入所述第二输入层,以使所述第二输入层生成所述当前输入文本中的各个词的第二词向量;将所述第二词向量输入所述第二编码器,以使所述第二编码器为所述当前输入文本中的各个词生成第二隐状态,并基于自注意力机制,根据所述第二隐状态为所述当前输入文本中的各个词生成所述第二自注意力特征;
使所述解码器获取当前步以及之前每一步生成的第三隐状态,并基于自注意力机制,根据所述第三隐状态生成当前步的所述第三自注意力特征。
2.根据权利要求1所述的方法,所述指代消解文本生成模型还包括第一指针网络和第二指针网络;
所述将所述历史对话文本和所述当前输入文本输入预先训练的指代消解文本生成模型,以使所述指代消解文本生成模型生成对应于所述当前输入文本的指代消解文本,具体包括:
将所述第一自注意力特征和所述第三自注意力特征输入所述第一指针网络,以使所述第一指针网络根据所述第一自注意力特征和所述第三自注意力特征,生成当前步的输出词对应为所述历史对话文本中的各个词的第一输出概率分布;
将所述第二自注意力特征和所述第三自注意力特征输入所述第二指针网络,以使所述第二指针网络根据所述第二自注意力特征和所述第三自注意力特征,生成当前步的输出词对应为所述当前输入文本中的各个词的第二输出概率分布。
3.根据权利要求2所述的方法,所述指代消解文本生成模型还包括感知器和输出层;
所述将所述历史对话文本和所述当前输入文本输入预先训练的指代消解文本生成模型,以使所述指代消解文本生成模型生成对应于所述当前输入文本的指代消解文本,具体包括:
将所述第一输出概率分布、所述第一自注意力特征、所述第二输出概率分布和所述第二自注意力特征输入所述感知器,以使所述感知器生成当前步的上下文特征,并根据所述上下文特征和所述第三自注意力特征预测生成当前步的第一输出权值和第二输出权值;其中,所述第一输出权值表示当前步的输出词来自于所述历史对话文本的概率,所述第二输出权值表示当前步的输出词来自于所述当前输入文本的概率;
将所述第一输出权值、所述第一输出概率分布、所述第二输出权值和所述第二输出概率分布输入所述输出层,以使所述输出层生成当前步的输出词对应为所述历史对话文本和所述当前输入文本中的各个字的加权输出概率分布,并将所述加权输出概率分布中的最大值对应的词作为当前步输出的输出词。
4.根据权利要求3所述的方法,所述将所述第一输出概率分布、所述第一自注意力特征、所述第二输出概率分布和所述第二自注意力特征输入所述感知器,以使所述感知器生成当前步的上下文特征,具体包括:
使所述感知器以所述第一输出概率分布为权重,对所述第一自注意力特征进行加权求和;以所述第二输出概率分布为权重,对所述第二自注意力特征进行加权求和;将上述两加权求和的结果相加,以得到所述上下文特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010467473.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示面板及显示装置
- 下一篇:一种环保型全钢轮胎胎侧胶及其制备方法