[发明专利]为视音频节目实时添加字幕的方法和装置在审
申请号: | 202010313136.3 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111556372A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 宣振生 | 申请(专利权)人: | 北京甲骨今声科技有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/4402;H04N21/439;G06F40/289 |
代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 高镇 |
地址: | 102488 北京市房山*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 节目 实时 添加 字幕 方法 装置 | ||
本申请公开了一种为视音频节目实时添加字幕的方法和装置,涉及辅助字幕领域。该方法包括:获取视音频节目;使用语音识别引擎实时将所述视音频节目的语音转换成文本;采用分词算法将所述文本生成字幕;将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。该装置包括:获取模块、识别模块、字幕模块和匹配模块。本发明实现了字幕和视音频画面“一块屏”的输出,彻底解决了听障人士无法观看无字幕视音频节目或只能多屏配合收看的痛处。
技术领域
本申请涉及辅助字幕领域,特别是涉及一种为视音频节目实时添加字幕的方法和装置。
背景技术
在数字有线电视时代,有线电视采用的是电视机+外置机顶盒的方式来实现播放的。在各种类型的视音频节目中,新闻和直播体育赛事等视音频节目均没有字幕,此种情况下聋人无法准确知晓视音频节目内容。根据第二次全国残疾人抽样调查,我国有2057万听力言语残疾人,占残疾人总数的三分之一。每年还新增聋儿3万人,这一群体对直播节目的字幕需求极为迫切。
目前,聋人收看无字幕电视节目采用的手段主要是,在手机上打开如讯飞听见、音书等APP,开启语音识别后,APP上就会出现当前播放的电视节目的声音转换后的文本,从而可以进行查看。
但是,上述现有技术的缺点显而易见,首先观看者需要同时观看电视屏幕和手机屏幕两块屏,在电视屏幕上观看视频画面,在手机屏幕上观看文本,无法同时顾及,体验非常差。另外,手机APP中转换出来的密密麻麻的大段文本,通常错别字较多,且毫无逻辑,理解起来相当吃力,根本无法与电视上分行显示且断句逻辑清晰的字幕相比,因此,对理解电视节目内容的效果大打折扣,无法满足听障人士获取字幕的现实需求。
发明内容
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
根据本申请的一个方面,提供了一种为视音频节目实时添加字幕的方法,包括:
获取视音频节目;
使用语音识别引擎实时将所述视音频节目的语音转换成文本;
采用分词算法将所述文本生成字幕;
将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。
可选地,采用分词算法将所述文本生成字幕,包括:
采用分词算法对所述文本进行分词、分句和分行处理后得到字幕。
可选地,采用分词算法对所述文本进行分词、分句和分行处理后得到字幕,包括:
采用分词算法对所述文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕。
可选地,所述方法还包括:
在分行之前,过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复文字。
可选地,所述方法还包括:
获取视音频节目之后,判断当前设置的字幕状态,如果为开启状态,则执行后续生成字幕及输出的流程,如果为关闭状态,则直接输出所述视音频节目。
根据本申请的另一个方面,提供了一种为视音频节目实时添加字幕的装置,包括:
获取模块,其配置成获取视音频节目;
识别模块,其配置成使用语音识别引擎实时将所述视音频节目的语音转换成文本;
字幕模块,其配置成采用分词算法将所述文本生成字幕;
匹配模块,其配置成将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。
可选地,所述字幕模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京甲骨今声科技有限公司,未经北京甲骨今声科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010313136.3/2.html,转载请声明来源钻瓜专利网。