[发明专利]一种上下文选择方法、装置、电子设备及存储介质有效
申请号: | 201810035965.2 | 申请日: | 2018-01-15 |
公开(公告)号: | CN110046338B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 刘乐茂;史树明 | 申请(专利权)人: | 深圳市腾讯计算机系统有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 上下文 选择 方法 装置 电子设备 存储 介质 | ||
1.一种上下文选择方法,其特征在于,包括:
获取源句子相应的源端向量表示序列;
根据当前时刻需预测的目标元素,假定所述目标元素在源句子中对齐的目标源词;
根据所述目标源词,从源句子中分隔出当前时刻相应的短语结构和半短语结构;其中,所述短语结构至少为确定性的;
至少根据所述目标源词、所述短语结构、半短语结构和所述源端向量表示序列,确定当前时刻相应的上下文。
2.根据权利要求1所述的上下文选择方法,其特征在于,所述根据当前时刻需预测的目标元素,假定所述目标元素在源句子中对齐的目标源词包括:
假定所述目标元素的值类型为终结符,确定所述目标元素在所述源句子中对齐的目标源词;其中,所述目标元素可能的值类型包括:终结符,左括号和右括号。
3.根据权利要求2所述的上下文选择方法,其特征在于,所述假定所述目标元素的值类型为终结符,确定所述目标元素在所述源句子中对齐的目标源词包括:
在假定所述目标元素的值类型为终结符时,确定所述目标元素在已预测出的值类型为终结符的元素中所对应的序数;
以所确定的序数,从源句子中确定相应序数的源词为所述目标源词。
4.根据权利要求2-3任一项所述的上下文选择方法,其特征在于,所述根据所述目标源词,从源句子中分隔出当前时刻相应的短语结构包括:
假定所述目标元素的值类型为右括号,从所述源句子中确定当前时刻相应的短语结构的起始词,将所述目标源词的前一词作为所述短语结构的末尾词,根据所述短语结构的起始词和末尾词确定当前时刻相应的短语结构。
5.根据权利要求4所述的上下文选择方法,其特征在于,所述假定所述目标元素的值类型为右括号,从所述源句子中确定当前时刻相应的短语结构的起始词包括:
在假定所述目标元素的值类型为右括号时,从已预测的元素中确定与所述目标元素最近的左括号开始的短语元素;
确定该左括号开始的短语元素的后一预测出的值类型为终结符的元素,及确定所述后一预测出的值类型为终结符的元素,在已预测出的值类型为终结符的元素中所对应的序数,从源句子中确定该序数相应的源词为所述短语结构的起始词。
6.根据权利要求2-3任一项所述的上下文选择方法,其特征在于,所述根据所述目标源词,从源句子中分隔出当前时刻相应的半短语结构包括:
假定所述目标元素的值类型为左括号,以所述目标源词为所述半短语结构的起始词,设置所述半短语结构的末尾词为所述目标源词后任一未知的源词,形成所述半短语结构。
7.根据权利要求1所述的上下文选择方法,其特征在于,所述至少根据所述目标源词、所述短语结构、半短语结构和所述源端向量表示序列,确定当前时刻相应的上下文包括:
根据公式ct=φ(ρ(xb,xt-1),ρ(xt,?),xt,Ex)确定当前时刻相应的上下文;
其中,ct表示当前时刻相应的上下文,xt为所述目标源词,xb为所述短语结构的起始词,Ex为所述源句子相应的源端向量表示序列,ρ(xb,xt-1)为当前时刻相应的短语结构,ρ(xt,?)为当前时刻相应的半短语结构。
8.根据权利要求7所述的上下文选择方法,其特征在于,所述φ的定义包括:
其中,θc表示基于确定性注意力机制的注意力层的参数,表示当前时刻相应的短语结构的起始词xb的向量表示,表示当前时刻相应的短语结构的末尾词的向量表示,表示所述目标源词的向量表示
或,
或,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810035965.2/1.html,转载请声明来源钻瓜专利网。