[发明专利]一种翻译模型的训练方法、装置以及机器可读介质在审
申请号: | 201711448599.5 | 申请日: | 2017-12-27 |
公开(公告)号: | CN109977426A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 施亮亮;王宇光;姜里羊;阳家俊;李响;卫林钰;陈伟 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 语种 标准文本 机器可读介质 训练数据 文本 变形 口语化 语音 转化 | ||
本发明实施例提供了一种翻译模型的训练方法、装置及机器可读介质,其中,所述方法包括:将第一语种的标准文本转化成第一语种的变形文本;将所述第一语种的标准文本、所述第一语种的变形文本以及所述第一语种的标准文本对应的第二语种文本作为翻译模型的训练数据,并依据所述训练数据对所述翻译模型进行训练。通过本发明实施例提供的翻译模型的训练方案训练出的翻译模型,可以精准地对用户输入的口语化语音进行同声翻译,提高翻译模型的翻译性能。
技术领域
本发明涉及双语翻译技术领域,特别是涉及一种翻译模型的训练方法、装置以及机器可读介质。
背景技术
随着国际性交流的增加,使用不同语种的语种沟通越来越频繁。为克服语种交流障碍,基于客户端中安装翻译模型,通过翻译模型进行在线语音翻译即同声翻译得到广泛的应用。
在线语音翻译一般涉及两个环节,第一是进行语音识别,即将用户输入的第一语种的语音信号转换为文本;第二是通过翻译模型对文本进行翻译,得到作为翻译结果的第二语种的文本,最后向用户提供第二语种文本或语言信息。
翻译模型基于双语句对训练生成,用于训练翻译模型的双语句对均为正式的书面语即为标准文本,因此翻译模型仅能精准的对用户输入的标准文本对应的语音进行同声翻译。而在实际应用过程中,碍于用户的说话习惯用户输入的待翻译语音过于口语化,此时翻译模型将无法精准地对用户输入的语音进行同声翻译,影响翻译模型的翻译性能。
发明内容
本发明提供了一种翻译模型的训练方法、装置以及机器可读介质,可以精准地对用户输入的口语化语音进行同声传译,提高翻译模型的传译性能。
为了解决上述问题,本发明公开了一种翻译模型的训练方法,其中,所述方法包括:将第一语种的标准文本转化成第一语种的变形文本;将所述第一语种的标准文本、所述第一语种的变形文本以及所述第一语种的标准文本对应的第二语种文本作为翻译模型的训练数据,并依据所述训练数据对所述翻译模型进行训练。
为了解决上述问题,本发明还公开了一种翻译模型的训练装置,其中所述装置包括:转化模块,用于将第一语种的标准文本转化成第一语种的变形文本;训练模块,用于将所述第一语种的标准文本、所述第一语种的变形文本以及所述第一语种的标准文本对应的第二语种文本作为翻译模型的训练数据,并依据所述训练数据对所述翻译模型进行训练。
为了解决上述问题,本发明又公开了一种用于翻译模型训练的装置,包括存储器,以及一个或者一个以上的程序,其中所述一个或者一个以上程序存储于所述存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:将第一语种的标准文本转化成第一语种的变形文本;将所述第一语种的标准文本、所述第一语种的变形文本以及所述第一语种的标准文本对应的第二语种文本作为翻译模型的训练数据,并依据所述训练数据对所述翻译模型进行训练。
为了解决上述问题,本发明还公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如本发明中所述的任意一种翻译模型的训练方法。
与现有技术相比,本发明具有以下优点:
本发明实施例提供的翻译模型的训练方法、装置以及机器可读介质,可以将用于训练模型的第一语种的标准文本转化成第一语种的变形文本;将第一语种的标准文本、第一语种的变形文本以及第一语种的标准文本对应的第二语种文本作为翻译模型的训练数据对翻译模型进行训练。由于训练得到的翻译模型中存在变形文本与标准文本的对应关系,因此当用户输入口语化语音时识别到其对应的变形文本后,可进一步确定该变形文本对应的翻译文本或翻译文本的语音输出,故可以精准地对用户输入的口语化语音进行同声翻译,提高翻译模型的翻译性能。
附图说明
图1是根据本发明实施例一的一种翻译模型的训练方法的步骤流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711448599.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本翻译方法及装置
- 下一篇:一种微型可佩戴的实时翻译装置