[发明专利]验证共有子词对XLM翻译模型效果影响的实验方法有效
申请号: | 202110079357.3 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112861516B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 余正涛;杨晓霞;吴霖;朱俊国;王振晗;文永华 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/226 | 分类号: | G06F40/226;G06F40/242;G06F40/284;G06F40/58 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 何娇 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及验证共有子词对XLM翻译模型效果影响的实验方法。本发明包括:对XLM翻译模型预训练的语料库进行预处理;验证XLM翻译模型性能是否退化:用预处理后的语料库对XLM翻译模型进行预训练,用预训练后的模型初始化翻译模型,观察新的翻译模型的BLEU值。预处理包括如下:首先获取英语和法语子词中的共有子词及所有子词词频;然后根据分离比例,随机对共有子词进行分离;随后读取所有英法子词的词表保存在词典中,用于后续生成分离子词文件;使用生成的分离子词文件初始化词典,最后使用初始化后的词典来结构化模型语料库文件。本发明验证了共有子词对BLEU值的影响,且本发明对非同源语言的低资源神经机器翻译研究有帮助。 | ||
搜索关键词: | 验证 共有 xlm 翻译 模型 效果 影响 实验 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110079357.3/,转载请声明来源钻瓜专利网。
- 上一篇:高温裂解污泥厌氧消化降温预处理设备及工艺
- 下一篇:一种光学玻璃制造方法