[发明专利]基于人工智能的视频字幕实时翻译方法、介质和设备在审
申请号: | 201910295229.5 | 申请日: | 2019-04-12 |
公开(公告)号: | CN110134973A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 张誉怀 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06K9/32 |
代理公司: | 深圳市立智方成知识产权代理事务所(普通合伙) 44468 | 代理人: | 王增鑫 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字幕 实时翻译 目标语言 文字内容 视频帧 人工智能 视频字幕 文字识别技术 翻译 满意度 视频流 预置 语言 应用 | ||
1.一种基于人工智能的视频字幕实时翻译方法,其特征在于,包括:
基于文字识别技术对当前视频帧的字幕进行识别,获取字幕的文字内容;
将所述文字内容输入预先训练的翻译模型,得到将所述文字内容翻译成预置目标语言的目标语言字幕;
在所述当前视频帧中显示所述目标语言字幕。
2.根据权利要求1所述的视频字幕翻译方法,其特征在于,所述基于文字识别技术对当前视频帧的字幕进行识别,获取字幕的文字内容之前,还包括:
接收用户发送的将字幕翻译成预置目标语言的请求;
响应所述请求,调起视频播放应用内置的翻译SDK;其中,所述翻译SDK包含预先训练的翻译模型。
3.根据权利要求1所述的视频字幕翻译方法,其特征在于,所述基于文字识别技术对当前视频帧的字幕进行识别,获取字幕的文字内容;将所述文字内容输入预先训练的翻译模型,得到将所述文字内容翻译成预置目标语言的目标语言字幕,包括:
判断是否预存有所述当前视频帧的字幕的文字内容;
若是,将预存的字幕的文字内容输入预先训练的翻译模型,得到将所述文字内容翻译成预置目标语言的目标语言字幕;
若否,基于文字识别技术对当前视频帧的字幕进行识别,获取字幕的文字内容;将所述文字内容输入预先训练的翻译模型,得到将所述文字内容翻译成预置目标语言的目标语言字幕。
4.根据权利要求1所述的视频字幕翻译方法,其特征在于,所述将所述文字内容输入预先训练的翻译模型,得到目标语言字幕,包括:
根据所述文字内容,确定字幕的初始语言;
根据所述初始语言和所述目标语言,获取预先训练的用于将所述初始语言翻译为所述预置目标语言的翻译模型;
将所述文字内容输入所述用于将所述初始语言翻译为所述预置目标语言的翻译模型,得到将所述文字内容翻译成预置目标语言的目标语言字幕。
5.根据权利要求1所述的视频字幕翻译方法,其特征在于,所述将所述文字内容输入预置的翻译模型,得到目标语言字幕,包括:
获取预先训练的多语言翻译模型;
将所述文字内容输入所述多语言翻译模型,得到将所述文字内容翻译成预置目标语言的目标语言字幕。
6.根据权利要求1所述的视频字幕翻译方法,其特征在于,所述在所述当前视频帧中显示所述目标语言字幕,包括:
在所述当前视频帧中覆盖显示或者添加显示所述目标语言字幕。
7.根据权利要求1所述的视频字幕翻译方法,其特征在于,所述在所述当前视频帧中显示所述目标语言字幕之后,还包括:
采集用户对所述目标语言字幕的校正信息;
根据所述校正信息,生成修正样本;
根据所述修正样本,修正所述翻译模型。
8.一种基于人工智能的视频字幕实时翻译装置,其特征在于,包括:
字幕内容获取模块,用于基于文字识别技术对当前视频帧的字幕进行识别,获取字幕的文字内容;
翻译模块,用于将所述文字内容输入预先训练的翻译模型,得到将所述文字内容翻译成预置目标语言的目标语言字幕;
翻译字幕显示模块,用于在所述当前视频帧中显示所述目标语言字幕。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的基于人工智能的视频字幕实时翻译方法。
10.一种计算机设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个计算机程序配置用于:执行根据权利要求1至7任一项所述的基于人工智能的视频字幕实时翻译方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910295229.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:词嵌入模型的增量生成
- 下一篇:集成电路和应用其的电机装置