[发明专利]字幕处理方法、装置及电子设备有效
申请号: | 202011159807.1 | 申请日: | 2020-10-26 |
公开(公告)号: | CN112261321B | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 海同舟 | 申请(专利权)人: | 维沃移动通信有限公司 |
主分类号: | H04N5/278 | 分类号: | H04N5/278;H04N5/262;G10L17/02 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 乔珊珊 |
地址: | 523863 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字幕 处理 方法 装置 电子设备 | ||
1.一种字幕处理方法,其特征在于,所述方法包括:
按照预设方式生成视频语音中的各噪音片段对应的第一字幕;
显示每段所述第一字幕和预设控件;
在接收到对目标预设控件的第一输入的情况下,响应于所述第一输入对所述目标预设控件对应的所述第一字幕进行处理;
其中,预设方式包括以下至少之一:依据预设参数确定语音片段是否为噪音片段,并将噪音片段转换为第一字幕;依据预先训练的多模态模型,生成视频语音中的各段噪音片段对应的第一字幕,预设参数包括以下至少之一:语音片段的声音归属者信息、语音片段匹配的视频图像帧中人物信息以及语音片段与上下文的语义连贯度;
对所述第一字幕的处理包括以下至少之一:删除、恢复以及编辑。
2.根据权利要求1所述的方法,其特征在于,所述按照预设方式生成视频语音中的各噪音片段对应的第一字幕的步骤,包括:
将视频语音划分为多个语音片段;
分别确定各所述语音片段所属的类别;
将第一类别中包含的各语音片段确定为待筛选语音片段,其中,所述第一类别中包含的语音片段数量小于预设数量;
针对各所述待筛选语音片段,依据预设参数确定所述待筛选语音片段是否为噪音片段;
分别将各所述噪音片段转换为第一字幕。
3.根据权利要求2所述的方法,其特征在于,针对各所述待筛选语音片段,依据预设参数确定所述待筛选语音片段是否为噪声片段的步骤,包括:
针对各所述待筛选语音片段,确定所述待筛选语音片段的声音归属者的第一人物信息;
确定所述待筛选语音片段对应的视频图像帧中人物的第二人物信息;
所述第一人物信息与所述第二人物信息不匹配的情况下,确定所述待筛选语音片段为噪音片段,其中,第一人物信息和第二人物信息包括:人物性别和人物类型;
在所述第一人物信息与所述第二人物信息匹配的情况下,确定所述待筛选语音片段与上下文的语义是否连贯;
在所述待筛选语音片段与上下文的语义不连贯的情况下,确定所述待筛选语音片段为噪音片段。
4.根据权利要求2所述的方法,其特征在于,所述分别确定各所述语音片段所属的类别的步骤,包括:
分别提取各所述语音片段的语音特征向量;
将语音特征向量相似度大于预设相似度的各所述语音片段,划分至同一类别。
5.根据权利要求1所述的方法,其特征在于,所述按照预设方式生成视频语音中的各噪音片段对应的第一字幕的步骤,包括:
将所述视频语音转换成字幕文本;
将所述字幕文本和视频图像输入预先训练的多模态模型中,筛选得到各段噪音片段对应的第一字幕。
6.一种字幕处理装置,其特征在于,所述装置包括:
生成模块,用于按照预设方式生成视频语音中的各噪音片段对应的第一字幕;
显示模块,用于显示每段所述第一字幕和预设控件;
处理模块,用于在接收到对目标预设控件的第一输入的情况下,响应于所述第一输入对所述目标预设控件对应的所述第一字幕进行处理;
其中,预设方式包括以下至少之一:依据预设参数确定语音片段是否为噪音片段,并将噪音片段转换为第一字幕;依据预先训练的多模态模型,生成视频语音中的各噪音片段对应的第一字幕,预设参数包括以下至少之一:语音片段的声音归属者信息、语音片段匹配的视频图像帧中人物信息以及语音片段与上下文的语义连贯度;
对所述第一字幕的处理包括以下至少之一:删除、恢复以及编辑。
7.根据权利要求6所述的装置,其特征在于,所述生成模块包括:
第一子模块,用于将视频语音划分为多个语音片段;
第二子模块,用于分别确定各所述语音片段所属的类别;
第三子模块,用于将第一类别中包含的各语音片段确定为待筛选语音片段,其中,所述第一类别中包含的语音片段数量小于预设数量;
第四子模块,用于针对各所述待筛选语音片段,依据预设参数确定所述待筛选语音片段是否为噪音片段;
第五子模块,用于分别将各所述噪音片段转换为第一字幕。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011159807.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铸铁生产线调整方法、装置及服务器
- 下一篇:碳化硅电池