[发明专利]融合多层次语言特征知识的汉越神经机器翻译的方法在审
申请号: | 202011409192.3 | 申请日: | 2020-12-03 |
公开(公告)号: | CN112541364A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 余正涛;邹翔;赖华;徐毓;文永华;朱俊国 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/284;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 何娇 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及融合多层次语言特征知识的汉越神经机器翻译的方法,本发明分别对字符、词及短语三个不同层次的语言特征知识进行融合并分析,为了有效地利用不同层次的语言特征知识,本发明首先通过双向LSTM得到基于字符的词向量表示,然后将基于字符的词向量表示和预训练的词向量相结合,通过注意力机制,使模型能够动态地选择词向量和字符信息。其次通过在标准序列编码器的基础上构建一个短语树编码器的方法,进一步将句子中的短语信息融入到汉越神经机器翻译的序列转换过程中。实验结果表明,该融合方法可以有效地利用不同层次的语言特征知识弥补汉越语言对资源不足的问题,一定程度上提升了汉越翻译模型的性能。 | ||
搜索关键词: | 融合 多层次 语言 特征 知识 神经 机器翻译 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011409192.3/,转载请声明来源钻瓜专利网。