[发明专利]台词翻译方法、装置及翻译模型训练方法、装置在审
申请号: | 202011474963.7 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112560511A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 代嘉慧 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06K9/00;G06N3/08;G10L17/22 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 台词 翻译 方法 装置 模型 训练 | ||
本发明实施例提供了台词翻译方法、装置及翻译模型训练方法、装置,该方法包括:获取源语言的待翻译台词,待翻译台词来源于第一人物对象;确定待翻译台词所属的作品的第一作品题材,以及确定第一人物对象的第一社交信息,第一社交信息包括第一人物对象的身份信息,及第一人物对象和第二人物对象的身份关系;根据第一作品题材和第一社交信息,以及待翻译台词,确定第一输入特征;将第一输入特征输入预设翻译模型,得到待翻译台词对应的目标语言的台词。通过上述台词翻译方法翻译台词,不仅考虑了待翻译台词,还考虑到待翻译台词的第一人物对象的社交信息以及待翻译台词的所属作品的作品题材,增加了台词翻译的信息量,提高了台词翻译的准确度。
技术领域
本发明涉及机器翻译技术领域,特别是涉及台词翻译方法、装置及翻译模型训练方法、装置。
背景技术
机器翻译是一种将源语言翻译为目标语言的技术。通用领域中,机器翻译为句子到句子的翻译,也就是,将源语言的当前句子翻译为目标语言的句子。
但在特定领域,如电视剧、电影、小说等作品的台词翻译中,台词翻译的准确度较低。
发明内容
本发明实施例的目的在于提供一种台词翻译方法、装置、设备及存储介质,以提高台词翻译的准确度。具体技术方案如下:
为达到上述目的,本发明实施例提供了一种台词翻译方法,所述方法包括:
获取源语言的待翻译台词,所述待翻译台词来源于第一人物对象;
确定所述待翻译台词所属的作品的第一作品题材,以及确定所述第一人物对象的第一社交信息,所述第一社交信息包括所述第一人物对象的身份信息,及所述第一人物对象和第二人物对象的身份关系,所述第二人物对象为听取所述待翻译台词的人物对象;
根据所述第一作品题材和所述第一社交信息,以及所述待翻译台词,确定第一输入特征;
将所述第一输入特征输入预设翻译模型,得到所述待翻译台词对应的目标语言的台词。
可选的,所述确定所述第一人物对象的第一社交信息的步骤,包括:
获取所述第一人物对象的第一人脸图像,对所述第一人脸图像进行人脸识别,得到所述第一人物对象的第一身份信息;和/或获取所述第一人物对象的第一语音信号,对所述第一语音信号进行声纹识别,得到所述第一人物对象的第一身份信息;
获取所述第二人物对象的第二人脸图像,对所述第二人脸图像进行人脸识别,得到所述第二人物对象的第二身份信息;和/或获取所述第二人物对象的第二语音信号,对所述第二语音信号进行声纹识别,得到所述第二人物对象的第二身份信息;
根据所述第一身份信息与所述第二身份信息,确定所述第一人物对象与所述第二人物对象之间的身份关系,其中,所述第一人物对象的第一社交信息包括所述第一身份信息,以及所述第一人物对象与所述第二人物对象之间的身份关系。
可选的,所述根据所述第一作品题材和所述第一社交信息,以及所述待翻译台词,确定第一输入特征的步骤,包括:
根据多个预设类别和每一预设类别对应的社交信息,从所述多个预设类别中,确定所述第一社交信息对应的第一预设类别;
根据所述第一作品题材和所述第一预设类别,以及所述待翻译台词,确定所述第一输入特征。
可选的,所述根据所述第一作品题材和所述第一社交信息,以及所述待翻译台词,确定第一输入特征的步骤,包括:
按照预设排序规则,对所述第一作品题材、所述第一社交信息、分隔符和所述待翻译台词进行排序,得到第一输入特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011474963.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据销毁方法及装置
- 下一篇:一种业务测试的方法及装置