[发明专利]一种字幕叠加方法及装置在审
申请号: | 201710559772.2 | 申请日: | 2017-07-11 |
公开(公告)号: | CN107222792A | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | 牛伟;李俊 | 申请(专利权)人: | 成都德芯数字科技股份有限公司 |
主分类号: | H04N21/488 | 分类号: | H04N21/488;H04N21/439;H04N21/4402;H04N21/8547 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙)11371 | 代理人: | 宋南 |
地址: | 610000 四川省成都市武侯*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种字幕叠加方法及装置,应用于字幕叠加终端,该字幕叠加终端包括多个输入接口。所述方法包括接收分别从多个输入接口输入的TS流信号,将TS流信号的模式转换为指定模式;对转换后的TS流信号进行解码,获得音频流和视频流;对获得的音频流进行滤波处理,获得语音信息;通过语音识别将语音信息转换为文本信息,并根据文本信息生成对应的字幕图片;将视频流和字幕图片进行叠加处理,生成包括字幕的数据流视频文件。该字幕叠加方案可直接对无字幕的电视节目进行自动语音识别,以生成文本信息,并将文本信息转换为字幕图片以与视频流进行叠加生成包含字幕的数据流视频文件,以方便听力障碍人群收看电视节目。 | ||
搜索关键词: | 一种 字幕 叠加 方法 装置 | ||
【主权项】:
一种字幕叠加方法,其特征在于,应用于字幕叠加终端,所述字幕叠加终端包括多个输入接口,所述方法包括:接收分别从所述多个输入接口输入的TS流信号,将所述TS流信号的模式转换为指定模式;对转换后的TS流信号进行解码,获得音频流和视频流;对获得的所述音频流进行滤波处理,获得语音信息;通过语音识别将所述语音信息转换为文本信息,并根据所述文本信息生成对应的字幕图片;将所述视频流和所述字幕图片进行叠加处理,生成包括字幕的数据流视频文件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都德芯数字科技股份有限公司,未经成都德芯数字科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710559772.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种视频通话信息的切换方法、系统及服务器
- 下一篇:一种智能音箱显示装置