[发明专利]教学视频自动字幕处理方法与系统有效
申请号: | 202010891570.X | 申请日: | 2020-08-31 |
公开(公告)号: | CN111986656B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 樊星 | 申请(专利权)人: | 上海松鼠课堂人工智能科技有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/26;H04N5/278;G09B5/06;G06K9/00;G06Q50/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200237 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 教学 视频 自动 字幕 处理 方法 系统 | ||
本发明提供了教学视频自动字幕处理方法与系统,其通过对教学视频进行图像/声音数据拆解与划分、语音识别、文字片段转换、字幕片段编辑与添加以及图像/声音数据重组合来生成带有自动显示字幕的教学视频,其通过自动化的方式来识别教学视频中的声音信息,再根据该声音信息生成相应的字幕以添加到教学视频中,其能够快速地对教学视频进行字幕的自动加工处理,从而提高教学视频自动加工形成字幕的效率和降低字幕加工的出错几率。
技术领域
本发明涉及智能教育的技术领域,特别涉及教学视频自动字幕处理方法与系统。
背景技术
目前,智能教学需要借助相应的教学视频执行预设课程的教授,而现有的教学视频通常都是预先录制形成的,但是录制形成的教学视频是未配置有字幕的,在缺少字幕的情况下,用户可能无法清楚地和准确地理解教学视频中的语音信息,这严重地降低了教学视频对不同场合的适用性。现有技术通常是通过人工方式识别教学视频中的语音信息,再根据该语音信息生成相应的字幕以添加到教学视频中,但是这种方式不仅工作大、效率低下,并且还容易出现字幕翻译错误和字幕显示时序发生偏差的情况。
发明内容
针对现有技术存在的缺陷,本发明提供教学视频自动字幕处理方法与系统,其通过将预设教学视频拆解为连续图像数据和连续声音数据,并按照该预设教学视频的播放时间轴信息,将该连续图像数据和该连续声音数据分别划分为若干图像帧片段子数据和若干声音片段子数据,并对若干该声音片段子数据进行语音识别,从而获得关于每一个该声音片段子数据对应的语音识别数据,并将该语音识别数据转换为预设语种的文字片段数据,再将所有文字片段数据编辑成为具有预设显示形式的字幕片段数据,并根据该播放时间轴信息,将所有字幕片段数据添加至其对应的图像帧片段子数据中,再将若干该图像帧片段子数据与若干该声音片段子数据重新组合,从而生成带有自动显示字幕的教学视频;可见,该教学视频自动字幕处理方法与系统通过对教学视频进行图像/声音数据拆解与划分、语音识别、文字片段转换、字幕片段编辑与添加以及图像/声音数据重组合来生成带有自动显示字幕的教学视频,其通过自动化的方式来识别教学视频中的声音信息,再根据该声音信息生成相应的字幕以添加到教学视频中,其能够快速地对教学视频进行字幕的自动加工处理,从而提高教学视频自动加工形成字幕的效率和降低字幕加工的出错几率。
本发明提供教学视频自动字幕处理方法,其特征在于,其包括如下步骤:
步骤S1,将预设教学视频拆解为连续图像数据和连续声音数据,并按照所述预设教学视频的播放时间轴信息,将所述连续图像数据和所述连续声音数据分别划分为若干图像帧片段子数据和若干声音片段子数据;
步骤S2,对若干所述声音片段子数据进行语音识别,从而获得关于每一个所述声音片段子数据对应的语音识别数据,并将所述语音识别数据转换为预设语种的文字片段数据;
步骤S3,将所有文字片段数据编辑成为具有预设显示形式的字幕片段数据,并根据所述播放时间轴信息,将所有字幕片段数据添加至其对应的图像帧片段子数据中,再将若干所述图像帧片段子数据与若干所述声音片段子数据重新组合,从而生成带有自动显示字幕的教学视频;
进一步,在所述步骤S1中,将预设教学视频拆解为连续图像数据和连续声音数据,并按照所述预设教学视频的播放时间轴信息,将所述连续图像数据和所述连续声音数据分别划分为若干图像帧片段子数据和若干声音片段子数据具体包括,
步骤S101,在同一起始时刻对所述预设教学视频进行图像-声音数据分离处理,从而分别提取得到所述连续图像数据和所述连续声音数据;
步骤S102,以所述同一起始时刻为基准,从所述预设教学视频中提取得到所述播放时间轴信息,并将所述播放时间轴信息划分为若干具有相同长度的播放时间间隔;
步骤S103,按照若干所述播放时间间隔,将所述连续图像数据和所述连续声音数据分别划分为若干所述图像帧片段子数据和若干所述声音片段子数据,其中,每一个所述图像帧片段子数据和每一个所述声音片段子数据均具有相同的持续时间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海松鼠课堂人工智能科技有限公司,未经上海松鼠课堂人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010891570.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蛋黄腌制装置和方法
- 下一篇:一种智能口腔检测系统及口腔图像检测方法