[发明专利]语音端点检测中短时能频值的提取方法有效

申请号：	200810116461.X	申请日：	2008-07-10
公开（公告）号：	CN101625858A	公开（公告）日：	2010-01-13
发明（设计）人：	李祺;马华东;郑侃彦;韩忠涛;张婷	申请（专利权）人：	新奥特（北京）视频技术有限公司
主分类号：	G10L11/00	分类号：	G10L11/00;G10L11/02;G10L15/04
代理公司：	北京天悦专利代理事务所	代理人：	田明;任晓航
地址：	100080北京市海淀区西草场***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及自动字幕生成系统中的语音检测技术，具体涉及一种语音端点检测中短时能频值的提取方法。该方法将音频采样序列分成固定长度的帧，并形成一个帧序列；针对每一帧数据提取短时能量、短时过零率和短时信息熵三个音频特征参数；根据上述音频特征参数计算每一帧数据的短时能频值，并形成一个短时能频值序列。本发明将时域和频域的音频特征参数结合在一起，能够发挥它们各自的长处，同时又可以在一定程度上规避各自的缺点，从而能够有效的应对各种不同类型的背景噪声。
搜索关键词：	语音端点检测中短时能频值提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音端点检测中短时能频值的提取方法，包括如下步骤：(1)将音频采样序列分成固定长度的帧，并形成一个帧序列；(2)针对每一帧数据提取短时能量、短时过零率和短时信息熵三个音频特征参数；(3)根据上述音频特征参数按如下公式计算每一帧数据的短时能频值，并形成一个短时能频值序列，EZE-featurei＝(Ei-Eb)·(Zi-Zb)·(Hi-Hb)其中，EZE-featurei表示第i帧的短时能频值；Ei、Zi和Hi分别表示第i帧的短时能量、短时过零率和短时信息熵；Eb、Zb和Hb分别表示当前背景噪声的短时能量、短时过零率和短时信息熵。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于新奥特（北京）视频技术有限公司，未经新奥特（北京）视频技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200810116461.X/，转载请声明来源钻瓜专利网。

上一篇：自动字幕生成系统中语音区间的检测方法
下一篇：跨桌面和嵌入式系统的图形界面开发方法及系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L11-00 不限定于G10L 15/00至G10L 21/00单独一组中的语音或音频特征的测定或检测
G10L11-02 .检测有无语音信号
G10L11-04 .语音信号的音调测定
G10L11-06 .语音信号的浊音和清音之间的鉴别

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音端点检测中短时能频值的提取方法有效

专利文献下载