[发明专利]一种多媒体语音字幕生成的系统和方法有效
申请号: | 201510628334.8 | 申请日: | 2015-09-28 |
公开(公告)号: | CN105245917B | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 徐信 | 申请(专利权)人: | 徐信 |
主分类号: | H04N21/235 | 分类号: | H04N21/235;H04N21/233;H04N21/234;H04N21/488;G10L13/08 |
代理公司: | 北京金智普华知识产权代理有限公司11401 | 代理人: | 巴晓艳 |
地址: | 102206*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种多媒体语音字幕生成系统和方法,所述字幕生成系统包括控制模块、字幕处理模块、语音处理模块、校对分段模块和字幕输出模块,所述字幕处理模块、语音处理模块、校对分段模和字幕输出模块均连接在所述控制模块上,所述控制模块另一端连接云端服务器,所述方法通过对音视频的获取、分析、识别、切分、生成字幕、校准和后期加工等步骤,完成多媒体语音字幕的自动生成,解决了影视字幕依靠手工拍字幕局限性,无论音视频文件是否具有语音标准文档(即台词),均可自动高效连续生成字幕,人性化的人机交互系统可根据实际情况选择字幕样式,包括每行字数、行数和字体等,多次精准校对使生成的字幕与视频匹配率达100%。 | ||
搜索关键词: | 一种 多媒体 语音 字幕 生成 系统 方法 | ||
【主权项】:
一种多媒体语音字幕生成系统,其特征在于,所述字幕生成系统包括控制模块、字幕处理模块、语音处理模块、校对分段模块和字幕输出模块,所述字幕处理模块、语音处理模块、校对分段模和字幕输出模块均连接在所述控制模块上,所述控制模块另一端连接云端服务器,所述字幕处理模块包括字数选择单元、行数选择单元和显示标准生成单元,所述字数选择单元通过行数选择单元连接所述显示标准生成单元,所述字数选择单元和显示标准生成单元另一端均连接所述控制模块;所述字数选择单元为控制模块提供的影视节目有关规定或要求屏幕单行显示的最多字数,所述行数选择单元为根据影视节目有关规定或要求确定显示行数,所述显示标准生成模块输出为自动进行换行换帧显示的显示标准。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐信,未经徐信许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510628334.8/,转载请声明来源钻瓜专利网。
- 上一篇:PFC双重保护电路及空调
- 下一篇:一种110kV纯干式GIS交联电缆终端