[发明专利]数据处理方法、直播方法及装置在审
申请号: | 201610639385.5 | 申请日: | 2016-08-05 |
公开(公告)号: | CN107690089A | 公开(公告)日: | 2018-02-13 |
发明(设计)人: | 徐刚 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/4402;H04N21/488;H04N21/435;H04N21/475 |
代理公司: | 北京安信方达知识产权代理有限公司11262 | 代理人: | 李红爽,栗若木 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 直播 装置 | ||
技术领域
本发明涉及多媒体领域,尤其涉及一种数据处理方法、直播方法及装置。
背景技术
为了方便用户观看,电影、电视剧、综艺娱乐等录播节目在播放时都会加配字幕;通常,字幕由专业人员制作后合成到节目中。
而对于新闻、比赛等直播节目,由于是实时采集,传输和播放的,因此来不及通过人工方式插入字幕;而且节目中会发生什么是无法事先预知,所以也无法提前准备好匹配的字幕。
可见,相关技术中,直播节目中无法加配根据该节目制作的字幕。
另外,用户在观看节目的过程,需要手动进行操作,比如发弹幕、发红包等,比较不方便。
发明内容
本申请的一个方面提供一种数据处理方法、直播方法及装置,能够实时根据采集的音频数据插入语音识别得到的文字信息。
本申请采用如下技术方案。
一种数据处理方法,包括:
将所采集的音视频数据转换成预定格式的待播放数据,对所采集的音视频数据中的音频数据进行语音识别;
将所述语音识别得到的文字信息加入所述待播放数据中。
可选地,所述对所采集的音视频数据中的音频数据进行语音识别包括:
将所采集的音视频数据中的音频数据分段,逐段进行语音识别。
可选地,所述将所采集的音视频数据中的音频数据分段包括:
在所采集的音视频数据中的音频数据里,将能量持续小于预定阈值的部分作为不同段之间的间隔,按照所述间隔对所采集的音视频数据中的音频数据进行分段;
其中,能量持续小于预定阈值是指能量小于预定阈值的时间长度达到预定时长。
可选地,所述将语音识别得到的文字信息加入所述待播放数据中包括:
根据语音识别得到的文字信息生成字幕,将生成的字幕按照时间轴信息合成到所述待播放数据中。
可选地,所述将所采集的音视频数据转换成预定格式的待播放数据包括:
将所采集的音视频数据进行编码后,封装成流媒体码流。
可选地,所述将所采集的音视频数据转换成预定格式的待播放数据,对所采集的音视频数据中的音频数据进行语音识别包括:
将所采集的音视频数据逐帧转换成预定格式的待播放数据,放入第一先进先出队列;
对所采集的音视频数据中的音频数据进行语音识别,将所述语音识别得到的文字信息放入第二先进先出队列。
可选地,所述将语音识别得到的文字信息加入所述待播放数据中包括:
从所述第一先进先出队列中提取待播放数据,从所述第二先进先出队列中提取相应的文字信息;
将提取出的文字信息加入提取出的待播放数据;
将加入文字信息后的待播放数据放入第三先进先出队列。
一种直播方法,包括:
采集音视频数据;
将所采集的音视频数据转换成流媒体码流,对所采集的音视频数据中的音频数据进行语音识别;
将所述语音识别得到的文字信息加入所述流媒体码流中;
将加入所述文字信息的流媒体码流发送到内容分发网络源站。
一种数据处理装置,包括:
处理模块,用于将所采集的音视频数据转换成预定格式的待播放数据,对所采集的音视频数据中的音频数据进行语音识别;
集成模块,用于将所述语音识别得到的文字信息加入所述待播放数据中。
可选地,所述处理模块包括:
转换单元,用于将所采集的音视频数据转换成预定格式的待播放数据;
语音识别单元,用于对所采集的音视频数据中的音频数据进行语音识别;
分发单元,用于对所采集的音视频数据中的音频数据进行复制,将所采集的音视频数据发送到所述转换单元,将复制的音频数据发送到所述语音转换单元。
可选地,所述对所采集的音视频数据中的音频数据进行语音识别包括:
将所采集的音视频数据中的音频数据分段,逐段进行语音识别。
可选地,所述将所采集的音视频数据中的音频数据分段包括:
在所采集的音视频数据中的音频数据里,将能量持续小于预定阈值的部分作为不同段之间的间隔,按照所述间隔对所采集的音视频数据中的音频数据进行分段;
其中,能量持续小于预定阈值是指能量小于预定阈值的时间长度达到预定时长。
可选地,所述集成模块将语音识别得到的文字信息加入所述待播放数据中包括:
根据语音识别得到的文字信息生成字幕,将生成的字幕按照时间轴信息合成到所述待播放数据中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610639385.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种血栓的检测方法及其装置
- 下一篇:一种具有高负载能力的医疗机器人手臂机构