[发明专利]一种基于迁移学习的蒙汉互译方法在审
申请号: | 201910806877.2 | 申请日: | 2019-08-29 |
公开(公告)号: | CN110688862A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 苏依拉;赵亚平;牛向华;孙晓骞;王宇飞;高芬;张振 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/04;G06N3/08 |
代理公司: | 61215 西安智大知识产权代理事务所 | 代理人: | 段俊涛 |
地址: | 010080 内蒙古自治区呼*** | 国省代码: | 内蒙;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是为解决目前蒙汉机器翻译译文质量低、翻译效果差问题提出的。蒙古语属于低资源语言,收集大量的蒙汉平行双语语料库极为困难,本发明中将迁移学习与先验知识相融合的思想有效的解决这一难题。迁移学习是运用已有的知识对不同但是相关领域问题进行求解的方法。首先,利用大规模的英‑汉平行语料基于神经机器翻译框架进行训练;其次,将大规模的英‑汉平行语料训练好的翻译模型参数权重迁移到蒙汉神经机器翻译框架中;再次,将通过大规模语料训练得到丰富的词汇、句法等相关知识表示信息融合到蒙汉神经机器翻译模型中;最后,利用现有的蒙‑汉平行语料训练神经机器翻译模型。 | ||
搜索关键词: | 机器翻译 平行 神经 语料 迁移 翻译模型参数 大规模语料 双语语料库 先验知识 信息融合 知识表示 蒙古语 求解 句法 权重 译文 词汇 翻译 学习 融合 语言 | ||
【主权项】:
1.一种基于迁移学习的蒙汉互译方法,其特征在于,首先,利用大规模的英汉平行语料进行英汉神经机器翻译模型训练;其次,将训练学到的网络参数权重迁移到蒙汉神经机器翻译模型中;再次,进行蒙汉大规模语料训练得到相关知识表示信息,将所述相关知识表示信息融合到蒙汉神经机器翻译模型中;最后,利用现有的蒙-汉平行语料训练神经机器翻译模型,利用训练的该模型进行蒙汉互译。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910806877.2/,转载请声明来源钻瓜专利网。