[发明专利]视频数据处理方法及装置、存储介质、计算机设备在审
申请号: | 202210492378.2 | 申请日: | 2022-05-07 |
公开(公告)号: | CN115604535A | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | 刘超;董志;蔡家敏 | 申请(专利权)人: | 六安科亚信息科技有限公司 |
主分类号: | H04N21/485 | 分类号: | H04N21/485;H04N21/233;H04N21/235;H04N21/239;H04N21/2187;H04N21/437;G10L13/033;G10L13/08;G10L15/22;G10L15/26;G06F16/783;G06F9/50 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 231300 安徽省六安市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 数据处理 方法 装置 存储 介质 计算机 设备 | ||
1.一种视频数据处理方法,其特征在于,包括:
基于应用运行终端的视频播放请求,通过源进程向所述应用运行终端推送源语言的初始视频数据;
当接收到视频语言切换指令时,断开所述源进程与所述应用运行终端之间的连接,基于所述视频语言切换指令指示的目标语言,通过所述目标语言对应的目标进程建立与所述源进程之间的连接,并通过所述源进程向所述目标进程发送待推送视频数据;
建立所述目标进程与所述应用运行终端之间的连接,结束所述源进程,利用所述目标进程将所述待推送视频数据解析为待推送图像数据和待推送声音数据;
基于所述目标进程将所述待推送声音数据从所述源语言转换为所述目标语言,并将所述待推送图像数据以及转换后的待推送声音数据合成为目标推送视频数据,通过所述目标进程向所述应用运行终端推送所述目标推送视频数据。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标进程将所述待推送声音数据从所述源语言转换为所述目标语言,具体包括:
基于所述目标进程,对所述待推送声音数据进行语音识别得到待翻译文本数据,以及对所述待推送声音数据进行声音特征识别得到声音特征信息;
将所述待翻译文本数据翻译为基于所述目标语言的翻译文本数据,并基于所述声音特征信息对所述翻译文本数据进行声音合成,得到所述转换后的待推送声音数据。
3.根据权利要求2所述的方法,其特征在于,所述声音特征信息包括音速特征、音量特征、音色特征、音高特征、语调特征以及韵律节奏特征中至少一种;
所述基于所述声音特征信息对所述翻译文本数据进行声音合成,得到所述转换后的待推送声音数据,具体包括:
基于基准声音特征以及所述声音特征信息,对所述基准声音特征对应的基准声音参数进行调节,获得所述声音特征信息对应的声音特征参数,其中,所述基准声音参数包括基准音速参数、基准音量参数、基准音色参数、基准音高参数、基准语调参数以及基准韵律节奏参数;
利用语音合成技术,基于所述声音特征参数对所述翻译文本数据进行声音合成,得到所述转换后的待推送声音数据。
4.根据权利要求2所述的方法,其特征在于,所述将所述待推送图像数据以及转换后的待推送声音数据合成为目标推送视频数据,具体包括:
将所述待翻译文本数据和所述翻译文本数据作为所述待推送图像数据的字幕,逐帧为所述待推送图像数据添加字幕;
基于添加字幕后的待推送图像数据以及所述转换后的待推送声音数据,合成为所述目标推送视频数据。
5.根据权利要求2所述的方法,其特征在于,所述将所述待翻译文本数据翻译为基于所述目标语言的翻译文本数据,具体包括:
通过所述目标线程,根据预设翻译线路对应的输入参数拼装规则对所述待翻译文本数据进行拼装,得到与所述待翻译文本数据对应的翻译输入数据;
调用所述预设翻译线路,将所述翻译输入数据输入至所述预设翻译线路中进行翻译,得到翻译输出数据;
根据所述预设翻译线路对应的输出参数解析规则,对所述翻译输出数据进行解析,得到所述翻译文本数据。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述通过所述源进程向所述目标进程发送待推送视频数据,具体包括:
通过所述源进程向所述目标进程发送所述待推送视频数据以及已推送视频帧数;
相应地,所述建立所述目标进程与所述应用运行终端之间的连接之后,所述方法还包括:
通过所述目标进程从所述应用运行终端获取已播放视频帧数,并基于所述已播放视频帧数和所述已推送视频帧数,确定所述应用运行终端的当前缓存视频帧数;
通过所述目标进程获取与所述当前缓存视频帧数对应的终端缓存视频数据。
7.根据权利要求6所述的方法,其特征在于,所述利用所述目标进程将所述待推送视频数据解析为待推送图像数据和待推送声音数据,具体包括:
利用所述目标进程,将所述待推送视频数据以及所述终端缓存视频数据解析为所述待推送图像数据和所述待推送声音数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于六安科亚信息科技有限公司,未经六安科亚信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210492378.2/1.html,转载请声明来源钻瓜专利网。