[发明专利]一种实现视音频处理中字幕与语音同步的方法和系统有效

申请号：	200610113173.X	申请日：	2006-09-18
公开（公告）号：	CN1932976A	公开（公告）日：	2007-03-21
发明（设计）人：	王常波;杨列森;郭宗明;高国连;张磊	申请（专利权）人：	北京北大方正电子有限公司;北京大学
主分类号：	G10L21/06	分类号：	G10L21/06;G10L21/00;G10L15/00;H04N5/278
代理公司：	北京同达信恒知识产权代理有限公司	代理人：	黄志华
地址：	100085北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种实现视音频处理中字幕与语音同步的方法，该方法由视音频处理系统对音频文件中的语音文件进行扫描，在扫描的过程中通过浊音的语音信号的特征参数确定浊音所在的每个音节的起始时间和结束时间，将每个音节的起始时间保存到字幕文本中，作为对应文字在字幕文本中的出现时间，经过合成实现字幕与语音的同步。本发明还公开了一种实现视音频处理中字幕与语音同步的系统，该系统包括用户终端和视音频处理系统中的接收模块、处理模块和发送模块。本发明将视音频处理中字幕与语音的同步由手动操作变为由视音频处理系统完成，减少了手动操作可能带来的误差，有效提高后期编辑的工作效率。
搜索关键词：	一种实现音频处理字幕语音同步方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1、一种实现视音频处理中字幕与语音同步的方法，应用于视音频处理系统中，其特征在于，在视音频处理系统中预先保存有一帧语音的时间长度以及不同音素的语音信号在该时间长度内的特征参数，该方法包括以下步骤：A、视音频处理系统扫描语音文件；B、视音频处理系统根据语音信号的特征参数确定一帧语音的起始时间和结束时间；C、视音频处理系统根据语音信号的特征参数以及一帧语音的起始时间和结束时间确定一个音节的起始时间和结束时间；D、视音频处理系统将语音文件中每个音节的起始时间保存到字幕文本中。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京北大方正电子有限公司;北京大学，未经北京北大方正电子有限公司;北京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200610113173.X/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种实现视音频处理中字幕与语音同步的方法和系统有效

专利文献下载