[发明专利]一种字幕编辑方法、装置及计算机存储介质、电子设备有效
申请号: | 201911046035.8 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110781649B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 蔡贺;崔建伟;黄建新;张歆;黄伟峰;朱米春;杜伟;王一韩;闫磊;钱岳 | 申请(专利权)人: | 中央电视台 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/211;G06F40/284;G10L15/26 |
代理公司: | 北京新知远方知识产权代理事务所(普通合伙) 11397 | 代理人: | 马军芳;张艳 |
地址: | 100789 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字幕 编辑 方法 装置 计算机 存储 介质 电子设备 | ||
1.一种字幕编辑方法,其特征在于,包括:
确定用户对字幕文件的编辑请求;所述字幕文件为根据音频文件以及音频文件对应的文稿生成的包括每个词语的时间戳的字幕文件,所述编辑请求包括所述字幕文件中需要编辑的位置以及编辑类型;
根据所述需要编辑的位置以及编辑类型对所述位置前后的短句进行编辑,并生成编辑后的句子的时间码;所述短句包括一个或多个词语;
所述根据所述需要编辑的位置以及编辑类型对所述位置之前的第一短句以及所述位置之后的第二短句进行编辑,并生成编辑后的时间码,包括:
根据所述需要编辑的位置,确定所述位置前一词语对应的时间码以及所述位置后一词语对应的时间码,并将所述位置所在的句子拆分生成第一短句和第二短句;
根据所述位置前一词语对应的时间码生成所述第一短句的时间码,根据所述位置后一词语对应的时间码生成所述第二短句的时间码;
所述根据所述位置后一词语对应的时间码生成所述第二短句的时间码,包括:
根据所述位置后一词语对应的时间码以及预设停顿时间,确定所述第二短句的起始时间以及所述第二短句内其他词语的时间码;
根据所述第二短句的起始时间以及所述第二短句内其他词语对应的时间码,确定所述第二短句的结束时间。
2.根据权利要求1所述的方法,其特征在于,所述字幕文件的生成过程,包括:
确定音频文件以及所述音频文件对应的文稿;
将所述音频文件以及所述音频文件对应的文稿输入至预先训练得到的语音识别深度神经网络模型;所述语音识别深度神经网络模型输出带有所述音频文件对应的文稿中每个词语的时间戳的字幕文件。
3.根据权利要求2所述的方法,其特征在于,所述语音识别深度神经网络模型输出带有所述音频文件对应的文稿中每个词语的时间戳的字幕文件,包括:
所述语音识别深度神经网络模型将所述音频文件的每帧语音识别成状态序列;
根据所述音频文件中每帧语音的状态序列得到多个音素;
根据所述多个音素生成一个或多个单词;
将所述一个或多个单词与每帧语音内容匹配,得到每个词语对应的语音片段在时间轴上的相对时间位置;
根据所述每个词语对应的语音片段在时间轴上的相对时间位置确定每个词语的时间戳。
4.根据权利要求1所述的方法,其特征在于,所述编辑类型为合并,所述根据所述需要编辑的位置以及编辑类型对所述位置之前的第一短句以及所述位置之后的第二短句进行编辑,并生成编辑后的时间码,包括:
根据所述需要编辑的位置,确定所述位置前一词语所在的第一短句对应的时间码以及所述位置后一词语所在的第二短句对应的时间码,将所述第一短句和第二短句合并;
根据所述第一短句的起始时间码和所述第二短句的结束时间码生成所述合并后的句子的时间码。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一短句的起始时间码和所述第二短句的结束时间码生成所述合并后的句子的时间码,包括:
将所述第一短句的起始时间码作为合并后的句子的起始时间码;
根据预设停顿时间调整所述第二短句内每个词语对应的时间码,并将调整后的所述第二短句的最后一个词语的时间码作为合并后的句子的结束时间码。
6.根据权利要求1所述的方法,其特征在于,进一步包括:
在编辑完所述字幕文件之后,按照所述编辑后的字幕文件中每个短句对应的时间码输出所述编辑后的字幕文件中的短句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中央电视台,未经中央电视台许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911046035.8/1.html,转载请声明来源钻瓜专利网。