[发明专利]一种智慧课堂录制视频增加字幕的系统及方法在审
申请号: | 202110477210.X | 申请日: | 2021-04-29 |
公开(公告)号: | CN113207032A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 秦曙光;陈家峰 | 申请(专利权)人: | 读书郎教育科技有限公司 |
主分类号: | H04N21/433 | 分类号: | H04N21/433;H04N21/488;H04N21/845;H04N21/2187;G10L15/26 |
代理公司: | 广州德伟专利代理事务所(普通合伙) 44436 | 代理人: | 黄浩威 |
地址: | 528400 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智慧 课堂 录制 视频 增加 字幕 系统 方法 | ||
1.一种智慧课堂录制视频增加字幕的系统,其特征在于,包括:
视频录制模块:用于对智慧课堂的直播视频进行视频录制,得到录制视频文件;
音频提取模块:用于对视频录制模块录制得到的录制视频文件进行音频提取得到录制音频文件;
语音识别模块:用于录制音频文件进行语音识别,识别对应的文字内容,并同步记录可以识别得到文字内容的各段音频片段的起始时间和结束时间,建立各段音频片段和文字内容之间的关联关系;
字幕增加模块:用于根据各段音频片段的起始时间和结束时间,将各段文字内容展示在录制视频文件对应的各段视频片段中,各段文字内容的起始展示时间和结束展示时间与对应视频片段的起始时间和结束时间相对应;最终得到增加字幕内容后的视频文件;
编辑模块:用于供用户对增加字幕内容后的视频文件进行修改,包括改变文字内容的起始展示时间以及对文字内容进行修改。
2.根据权利要求1所述的系统,其特征在于,语音识别模块用于按照时间顺序依次对录制音频文件进行语音识别,首次识别到文字内容时记录当前时间为本音频片段的起始时间,当在某个时间起超过预设的时长无法再识别到文字内容时,记录该时间为本音频片段的结束时间;直至下一次再识别到文字内容时,记录该时间为下一音频片段的起始时间,以此类推,从而识别到可以识别到文字内容的各段音频片段以及获得各段音频片段的起始时间和结束时间。
3.一种利用权利要求1-2任一所述系统的方法,其特征在于,具体过程为:
智慧课堂的直播过程中,视频录制模块同步进行视频录制,直播结束后,视频录制结束得到录制视频文件;
音频提取模块对视频录制模块录制得到的录制视频文件进行音频提取得到录制音频文件;
语音识别模块对录制音频文件进行语音识别,识别对应的文字内容,并同步记录可以识别得到文字内容的各段音频片段的起始时间和结束时间,建立各段音频片段和文字内容之间的关联关系;
当用户触发增加字幕事件时,字幕增加模块根据各段音频片段的起始时间和结束时间,将各段文字内容展示在录制视频文件对应的各段视频片段中,各段文字内容的起始展示时间和结束展示时间与对应视频片段的起始时间和结束时间相对应;最终得到增加字幕内容后的视频文件;
当用户发现文字内容和录制视频文件的画面不匹配时,可通过编辑模块将对应文字内容的起始展示时间提前或推后,使其与录制视频文件的画面完全匹配;当用户发现文字内容有错误时,可通过编辑模块对文字内容进行修改。
4.根据权利要求3所述的方法,其特征在于,语音识别模块按照时间顺序依次对录制音频文件进行语音识别,首次识别到文字内容时记录当前时间为本音频片段的起始时间,当在某个时间起超过预设的时长无法再识别到文字内容时,记录该时间为本音频片段的结束时间;直至下一次再识别到文字内容时,记录该时间为下一音频片段的起始时间,以此类推,从而识别到可以识别到文字内容的各段音频片段以及获得各段音频片段的起始时间和结束时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于读书郎教育科技有限公司,未经读书郎教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110477210.X/1.html,转载请声明来源钻瓜专利网。