[发明专利]可分解变分自动编码器句子表示中的切分语法和语义有效
申请号: | 202110267233.8 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112818670B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 李定成;任绍刚;李平 | 申请(专利权)人: | 百度(美国)有限责任公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/30 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;王艳春 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可分解 自动 编码器 句子 表示 中的 切分 语法 语义 | ||
1.一种用于对表示进行解缠处理的、计算机实现的方法,包括:
接收令牌序列的输入;
使用包括第一嵌入层和第一注意层的第一组合,基于所述令牌序列生成第一隐藏变量序列;
使用包括第二嵌入层和第二注意层的第二组合,基于所述令牌序列生成第二隐藏变量序列;
使用语义编码器基于所述第一隐藏变量序列生成语义隐藏变量序列;
使用语法编码器基于所述第二隐藏变量序列生成语法隐藏变量序列;
基于所述语义隐藏变量序列和所述语法隐藏变量序列,使用解码器生成重构令牌序列和对应的重构注意力权重序列;响应于训练处理,构造一个或多个损失函数,使用所述重构令牌序列和对应的所述重构注意力权重序列来训练所述第一嵌入层、所述第二嵌入层、所述第一注意层、所述第二注意层、所述语义编码器、所述语法编码器和所述解码器中的至少一个;以及
响应于推断处理,为一个或多个自然语言处理应用输出所述重构令牌序列和对应的所述重构注意力权重序列。
2.如权利要求1所述的计算机实现的方法,其中:
使用以下步骤基于所述令牌序列生成所述第一隐藏变量序列:
在所述第一嵌入层处,从所述令牌序列中生成第一嵌入向量序列和第一掩码序列;
利用所述第一注意层,基于所述第一嵌入向量序列和所述第一掩码序列生成第一注意力权重序列;
通过所述第一嵌入向量序列与所述第一注意力权重序列的逐元素相乘,得到所述第一隐藏变量序列;以及
使用以下步骤基于所述令牌序列生成所述第二隐藏变量序列:
在所述第二嵌入层处,从所述令牌序列生成第二嵌入向量序列和第二掩码序列;
利用所述第二注意层基于所述第二嵌入向量序列和所述第二掩码序列生成第二注意力权重序列;以及
通过第二嵌入向量序列和第二注意力权重序列之间的逐元素相乘获得第二隐藏变量序列。
3.如权利要求1所述的计算机实现的方法,其中,所述语义隐藏变量序列的每个语义隐藏变量包括局部语义隐藏变量和全局语义隐藏变量,所述语法隐藏变量序列的每个语法隐藏变量包括局部语法隐藏变量和全局语法隐藏变量。
4.如权利要求1所述的计算机实现的方法,其中,所述第一嵌入层和所述第二嵌入层共享参数。
5.如权利要求1所述的计算机实现的方法,其中,所述第一嵌入层还是所述第二嵌入层。
6.如权利要求1所述的计算机实现的方法,其中,至少一个或多个所述损失包括所述语义编码器的Kullback-Leibler(KL)发散和所述语法编码器的KL发散。
7.如权利要求1所述的计算机实现的方法,其中,所述语义隐藏变量序列和所述语法隐藏变量序列被接连到所述解码器中,以生成所述重构令牌序列和对应的所述重构注意力权重序列。
8.如权利要求1所述的计算机实现的方法,其中,所述语义隐藏变量序列中的至少两个连续语义隐藏变量被交换以生成所述重构令牌序列和相应的所述重构注意力权重序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(美国)有限责任公司,未经百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110267233.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于坑塘改造的污水处理系统
- 下一篇:一种基于计算机主机的便捷式散热装置