[发明专利]一种上下文选择方法、装置、电子设备及存储介质有效
申请号: | 201810035965.2 | 申请日: | 2018-01-15 |
公开(公告)号: | CN110046338B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 刘乐茂;史树明 | 申请(专利权)人: | 深圳市腾讯计算机系统有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 上下文 选择 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供一种上下文选择方法、装置、电子设备及存储介质,该方法包括:获取源句子相应的源端向量表示序列;根据当前时刻需预测的目标元素,假定所述目标元素在源句子中对齐的目标源词;根据所述目标源词,从源句子中分隔出当前时刻相应的短语结构和半短语结构,其中,所述短语结构至少为确定性的;至少根据所述目标源词、所述短语结构、半短语结构和所述源端向量表示序列,确定当前时刻相应的上下文。本发明实施例可提升所捕捉的上下文的全面性,提升上下文选择的精度,为提升句法分析等结果的精度提供可能。
技术领域
本发明涉及人工智能技术领域,具体涉及一种上下文选择方法、装置、电子设备及存储介质。
背景技术
上下文选择是句法分析、机器翻译等过程的一个阶段,主要用于在解码器每次预测一个目标元素时,从源端的向量表示中选择上下文,以实现目标元素的预测。
以编码器和解码器架构的句法分析模型为例,在进行句法分析时,源句子(需进行句法分析的自然语言句子可称为源句子)输入句法分析模型后,编码器可生成源句子相应的源端向量表示序列(该源端向量表示序列包含源句子中的每个源词的向量表示),解码器每次预测一个元素时(元素为句法分析结果的组成,由各个素构成的序列可形成句法分析结果),句法分析模型中的注意力层可从源端的向量表示中选择上下文,以辅助元素的预测,从而在完成各个元素的预测后,生成句法分析结果。
上下文的选择主要通过注意力层实现,目前注意力层主要依赖基于概率的注意力机制,其通过生成一个离散概率分布,来表示当前预测的目标元素与源句子中源词的对齐概率,来实现上下文的选择。然而,本发明的发明人发现,基于概率的注意力机制并不能全面的捕捉上下文,如对句法分析场景中一些启发式的上下文并不能捕捉,导致上下文选择结果的精度降低,影响句法分析等结果的精度。
发明内容
有鉴于此,本发明实施例提供一种上下文选择方法、装置、电子设备及存储介质,以提升上下文选择的精度。
为实现上述目的,本发明实施例提供如下技术方案:
一种上下文选择方法,包括:
获取源句子相应的源端向量表示序列;
根据当前时刻需预测的目标元素,假定所述目标元素在源句子中对齐的目标源词;
根据所述目标源词,从源句子中分隔出当前时刻相应的短语结构和半短语结构;其中,所述短语结构至少为确定性的;
至少根据所述目标源词、所述短语结构、半短语结构和所述源端向量表示序列,确定当前时刻相应的上下文。
本发明实施例还提供一种上下文选择装置,包括:
源端向量序列获取模块,用于获取源句子相应的源端向量表示序列;
目标源词确定模块,用于根据当前时刻需预测的目标元素,假定所述目标元素在源句子中对齐的目标源词;
分隔模块,用于根据所述目标源词,从源句子中分隔出当前时刻相应的短语结构和半短语结构;其中,所述短语结构至少为确定性的;
上下文输出模块,用于至少根据所述目标源词、所述短语结构、半短语结构和所述源端向量表示序列,确定当前时刻相应的上下文。
本发明实施例还提供一种电子设备,包括:至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述程序,以实现上述所述的上下文选择方法的步骤。
本发明实施例还提供一种存储介质,所述存储介质存储有适于处理器执行的程序,以实现上述所述的上下文选择方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810035965.2/2.html,转载请声明来源钻瓜专利网。