[发明专利]一种实现视音频处理中字幕与语音同步的方法和系统有效
申请号: | 200610113173.X | 申请日: | 2006-09-18 |
公开(公告)号: | CN1932976A | 公开(公告)日: | 2007-03-21 |
发明(设计)人: | 王常波;杨列森;郭宗明;高国连;张磊 | 申请(专利权)人: | 北京北大方正电子有限公司;北京大学 |
主分类号: | G10L21/06 | 分类号: | G10L21/06;G10L21/00;G10L15/00;H04N5/278 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 黄志华 |
地址: | 100085北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种实现视音频处理中字幕与语音同步的方法,该方法由视音频处理系统对音频文件中的语音文件进行扫描,在扫描的过程中通过浊音的语音信号的特征参数确定浊音所在的每个音节的起始时间和结束时间,将每个音节的起始时间保存到字幕文本中,作为对应文字在字幕文本中的出现时间,经过合成实现字幕与语音的同步。本发明还公开了一种实现视音频处理中字幕与语音同步的系统,该系统包括用户终端和视音频处理系统中的接收模块、处理模块和发送模块。本发明将视音频处理中字幕与语音的同步由手动操作变为由视音频处理系统完成,减少了手动操作可能带来的误差,有效提高后期编辑的工作效率。 | ||
搜索关键词: | 一种 实现 音频 处理 字幕 语音 同步 方法 系统 | ||
【主权项】:
1、一种实现视音频处理中字幕与语音同步的方法,应用于视音频处理系统中,其特征在于,在视音频处理系统中预先保存有一帧语音的时间长度以及不同音素的语音信号在该时间长度内的特征参数,该方法包括以下步骤:A、视音频处理系统扫描语音文件;B、视音频处理系统根据语音信号的特征参数确定一帧语音的起始时间和结束时间;C、视音频处理系统根据语音信号的特征参数以及一帧语音的起始时间和结束时间确定一个音节的起始时间和结束时间;D、视音频处理系统将语音文件中每个音节的起始时间保存到字幕文本中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京北大方正电子有限公司;北京大学,未经北京北大方正电子有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200610113173.X/,转载请声明来源钻瓜专利网。