[发明专利]一种语音识别的端点检测方法无效
申请号: | 201110071269.5 | 申请日: | 2011-03-23 |
公开(公告)号: | CN102148030A | 公开(公告)日: | 2011-08-10 |
发明(设计)人: | 沈勇;陈磊敏;周杰 | 申请(专利权)人: | 同济大学 |
主分类号: | G10L11/02 | 分类号: | G10L11/02;G10L15/20 |
代理公司: | 上海智信专利代理有限公司 31002 | 代理人: | 吴林松 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 端点 检测 方法 | ||
1.一种语音识别的端点检测方法,其特征在于:其包括以下步骤:
1)采集背景噪声和含噪语音信号;
2)分析背景噪声和含噪语音信号的特性;
3)提取背景噪声线性预测模型的参数或者其LPC系数,作为背景噪声线性预测模板;
4)确定含噪语音信号的端点。
2.如权利要求1所述的语音识别的端点检测方法,其特征在于:所述步骤1)中是采集特定环境下的噪声和含噪声的语音信号,再将采集的信号经A/D转换器转换为数字信号,并进行存储。
3.如权利要求1所述的语音识别的端点检测方法,其特征在于:所述步骤2)是将步骤1)中采集的信号在时域上进行时域波形分析,进行分帧语音信号LPC系数分析。
4.如权利要求1所述的语音识别的端点检测方法,其特征在于:所述步骤3)是选取一段时间的信号作为声音的一帧,对每帧声音建立自回归移动平均模型,再提取自回归移动平均模型的参数作为背景噪声线性预测模型的参数;或者选取一段时间的信号作为声音的一帧,提取每帧声音固定阶数的LPC系数。
5.如权利要求1所述的语音识别的端点检测方法,其特征在于:所述步骤4)将背景噪声线性预测模型的参数或者LPC系数处理为特征参数,当特征参数的变化超出设定的范围时,即确定为语音端点。
6.如权利要求5所述的语音识别的端点检测方法,其特征在于:所述处理为特征参数的方法为:求取每帧声音信号的背景噪声线性预测模型的参数与背景噪声线性预测模板的相对应参数之差,再求取它们的平方和,把这个平方和的值作为特征参数;或者将每帧声音的背景噪声线性预测模型LPC系数与背景噪声线性预测模板的相对应系数相减,再求其平方和,把这个平方和的值作为特征参数。
7.如权利要求1所述的语音识别的端点检测方法,其特征在于:所述步骤4)中确定端点之前,进一步对背景噪声线性预测模板进行修正。
8.如权利要求7所述的语音识别的端点检测方法,其特征在于:所述对背景噪声线性预测模板的修正是将相邻时间段的自回归移动平均模型的参数或者其LPC系数进行加权修正,将修正后的参数或者系数作为背景噪声线性预测模板。
9.如权利要求8所述的语音识别的端点检测方法,其特征在于:所述加权修正采用自适应滤波算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110071269.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:闪光白人造大理石
- 下一篇:基于渲染的单幅图像单点光源定位方法