[发明专利]为视音频节目实时添加字幕的方法和装置在审
申请号: | 202010313136.3 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111556372A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 宣振生 | 申请(专利权)人: | 北京甲骨今声科技有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/4402;H04N21/439;G06F40/289 |
代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 高镇 |
地址: | 102488 北京市房山*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 节目 实时 添加 字幕 方法 装置 | ||
1.一种为视音频节目实时添加字幕的方法,包括:
获取视音频节目;
使用语音识别引擎实时将所述视音频节目的语音转换成文本;
采用分词算法将所述文本生成字幕;
将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。
2.根据权利要求1所述的方法,其特征在于,采用分词算法将所述文本生成字幕,包括:
采用分词算法对所述文本进行分词、分句和分行处理后得到字幕。
3.根据权利要求2所述的方法,其特征在于,采用分词算法对所述文本进行分词、分句和分行处理后得到字幕,包括:
采用分词算法对所述文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在分行之前,过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复文字。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:
获取视音频节目之后,判断当前设置的字幕状态,如果为开启状态,则执行后续生成字幕及输出的流程,如果为关闭状态,则直接输出所述视音频节目。
6.一种为视音频节目实时添加字幕的装置,包括:
获取模块,其配置成获取视音频节目;
识别模块,其配置成使用语音识别引擎实时将所述视音频节目的语音转换成文本;
字幕模块,其配置成采用分词算法将所述文本生成字幕;
匹配模块,其配置成将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。
7.根据权利要求6所述的装置,其特征在于,所述字幕模块包括:
分词算法单元,其配置成采用分词算法对所述文本进行分词、分句和分行处理后得到字幕。
8.根据权利要求7所述的装置,其特征在于,所述分词算法单元具体配置成:
采用分词算法对所述文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕。
9.根据权利要求7所述的装置,其特征在于,所述分词算法单元还配置成:
在分行之前,过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复文字。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述装置还包括:
控制模块,其配置成在所述获取模块获取视音频节目之后,判断当前设置的字幕状态,如果为开启状态,则触发所述识别模块执行后续流程,如果为关闭状态,则直接输出所述视音频节目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京甲骨今声科技有限公司,未经北京甲骨今声科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010313136.3/1.html,转载请声明来源钻瓜专利网。