[发明专利]一种自适应的语音端点检测方法有效

申请号：	200810116450.1	申请日：	2008-07-10
公开（公告）号：	CN101625857A	公开（公告）日：	2010-01-13
发明（设计）人：	李祺;马华东;郑侃彦;韩忠涛;张婷	申请（专利权）人：	新奥特（北京）视频技术有限公司
主分类号：	G10L11/00	分类号：	G10L11/00;G10L11/02;G10L15/04
代理公司：	北京天悦专利代理事务所	代理人：	田明;任晓航
地址：	100080北京市海淀区西草场***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及自动字幕生成系统中的语音检测技术，具体涉及一种自适应的语音端点监测方法。该方法将音频采样序列分成固定长度的帧，并形成一个帧序列，针对每一帧数据提取短时能量、短时过零率和短时信息熵三个音频特征参数；根据音频特征参数计算每一帧数据的短时能频值，并形成一个短时能频值序列；从第一帧数据开始，分析短时能频值序列，并找出一对语音起点和终点；分析背景噪声，如果发现背景噪声发生改变，则重新计算背景噪声的音频特征参数，并更新短时能频值序列；重复此过程直到检测结束。本发明可以在背景噪声经常发生变化的情况下，对连续语音进行语音端点检测，从而提高在复杂噪声背景下的语音端点检测效率。
搜索关键词：	一种自适应语音端点检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种自适应的语音端点检测方法，包括如下步骤：(1)音频数据输入后，解析音频文件并提取数字采样值，对获取到的音频采样序列进行带通滤波；(2)将音频采样序列分成固定长度的帧，并形成一个帧序列，针对每一帧数据提取短时能量、短时过零率和短时信息熵三个音频特征参数；(3)根据上述音频特征参数计算每一帧数据的短时能频值，并形成一个短时能频值序列；(4)从第一帧数据开始，分析短时能频值序列，并找出一对语音起点和终点；(5)分析背景噪声，如果发现背景噪声发生改变，则重新计算背景噪声的音频特征参数，并更新短时能频值序列；(6)返回步骤(4)，继续寻找下一对语音起点和终点，重复此过程直到检测结束，并输出语音端点检测结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于新奥特（北京）视频技术有限公司，未经新奥特（北京）视频技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200810116450.1/，转载请声明来源钻瓜专利网。

上一篇：一种IP多媒体子系统铃音媒体播放方法及系统
下一篇：一种请求消息处理系统、方法及装置和一种聚合代理

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L11-00 不限定于G10L 15/00至G10L 21/00单独一组中的语音或音频特征的测定或检测
G10L11-02 .检测有无语音信号
G10L11-04 .语音信号的音调测定
G10L11-06 .语音信号的浊音和清音之间的鉴别

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种自适应的语音端点检测方法有效

专利文献下载