[发明专利]台词同步字幕的制作方法有效
申请号: | 201510046064.X | 申请日: | 2015-01-29 |
公开(公告)号: | CN104599693B | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 杜南山;江潮 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G11B27/10 | 分类号: | G11B27/10 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 刘杰 |
地址: | 430074 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及自然语言处理技术领域,公开了一种台词同步字幕的制作方法,包括步骤:I、截取台词的音频信息,通过自动语音识别产生初始字幕文件,所述初始字幕文件包括若干字幕段,以及字幕段的开始和结束时间;Ⅱ、将台词剧本与所述初始字幕文件进行对照,建立台词剧本中每句台词与初始字幕文件中字幕段的对应关系;Ⅲ、用台词剧本中的台词句生成新的字幕段,并在所述新字幕段上添加该字幕段的开始和结束时间,生成中间字幕文件。本发明能自动确定绝大部分台词字幕段的开始和结束时间,减少了人力资源代价,台词字母的准确度高,极大提高了视频字幕制作的效率。 | ||
搜索关键词: | 字幕文件 字幕 同步字幕 制作 自然语言处理技术 自动语音识别 准确度 人力资源 视频字幕 台词字幕 音频信息 自动确定 截取 词句 | ||
【主权项】:
1.一种台词同步字幕的制作方法,其特征在于,包括如下步骤:Ⅰ、截取台词的音频信息,通过自动语音识别产生初始字幕文件,所述初始字幕文件包括若干字幕段,以及字幕段的开始和结束时间;所述字幕段对应一句台词音频,所述字幕段的开始和结束时间即为对应台词句音频的起始和结束时间;Ⅱ、将台词剧本与所述初始字幕文件进行对照,建立台词剧本中每句台词与初始字幕文件中字幕段的对应关系;Ⅲ、根据台词剧本中的台词句与初始字幕文件中字幕段的对应关系,用台词剧本中的台词句生成新的字幕段,并在所述新字幕段上添加该字幕段的开始和结束时间,生成中间字幕文件;所述将台词剧本与所述初始字幕文件进行对照,建立台词剧本中每句台词与初始字幕文件中字幕段的对应关系,包括以下步骤:ⅰ、逐句读取台词剧本中的台词句,在所述初始字幕文件中查找与该台词句包含词汇相同的相同词,每个所述相同词标记有字幕段的序号;建立每个台词句与所述相同词及其字幕段序号的映射表;ⅱ、根据连续相同词的数量大小进行第一次排序,得到具有先后顺序的相同词与台词句的对应关系表;ⅲ、设置所述相同词与台词句的初始的对应关系集合Q为空,即:从对应关系表的第一个对应关系开始,取第一个对应关系放入对应关系集合Q中,然后,循环进行下列操作:①顺序取一个对应关系,判断该对应关系是否与对应关系集合Q中的已有的确认对应关系冲突,判断方法为:对应关系(a)‑b与已有的确认对应关系冲突,是指(a)、b满足如下条件:或者,其中(a)表示台词剧本的台词句序号,b表示初始字幕文件的字幕段序号;②如果不存在冲突,则确认该对应关系,将该对应关系加入对应关系集合Q中;并在所述对应关系表中删除包含该台词句序号的其它对应关系;③如果存在冲突,则直接删除该对应关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510046064.X/,转载请声明来源钻瓜专利网。
- 上一篇:具有嵌入式ROM的SRAM
- 下一篇:电话线质量语音的基音周期提取方法