[发明专利]一种突发事件语音检测方法无效
申请号: | 201110160096.4 | 申请日: | 2011-06-15 |
公开(公告)号: | CN102201230A | 公开(公告)日: | 2011-09-28 |
发明(设计)人: | 张涛;杨雪;王赞;全浩军;孙文博 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L15/00 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 突发事件 语音 检测 方法 | ||
技术领域
本发明属于音频检测技术领域,具体涉及一种突发事件语音检测方法。
背景技术
通常的语音识别系统由语音特征参数提取算法和模式匹配算法构成。
1)语音特征参数
用于语音分类的特征参数很多,可以归纳为三大类:时域特征参数、频域特征参数,同态(倒谱)特征参数。
时域特征参数包括:短时信号能量,短时信号平均过零率,信号短时自相关函数和平均幅度差函数。时域特征参数的特点是提取算法都不复杂,缺点是对信号的可鉴别能力有限,适用范围有端点检测和语音分帧。频域特征参数包括:傅里叶变换,离散余弦变换,线性预测分析。频域特征参数与人类听觉系统有一定的关系,但是频域特征参数适用于加性信号,对于复杂的乘积性组合信号处理能力不好。同态(倒谱)特征参数:非线性系统分析起来非常困难,需要进行同态分析,设法将非线性问题转化为线性问题来处理,对音频信号进行同态分析后,可得到音频信号的倒谱系数,因此同态分析也称倒谱分析。
倒谱分析通常采用线性预测倒谱系数(Linear Prediction Cepstrum Coefficient,LPCC)和Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)。LPCC算法的特点是高阶系数可以由低阶系数推到而得,所以计算量小,缺点是没有考虑人耳的听觉特性,故识别率不高。MFCC的特点是通过Mel滤波器组和对数运算的设计,模拟人耳听觉模型,识别效果相对较好,缺点是由于必须通过FFT运算,所以计算量较大。
另外,由于LPCC算法和MFCC算法有共同的假设前提,即一个语音信号完整的出现在一个样本周期内,如图1所示。但在实际情况中,一个完整的语音信号不一定就出现在一个周期内,可能在两个取样周期中出现,如图2所示。在这种情况下,无论是LPCC算法还是MFCC算法所提取的特征系数都不能完全体现此语音信号的特征,会影响后来的匹配和判决过程。
2)模式匹配及模型训练技术
语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(Dynamic Time Warping,DTW)、隐马尔可夫模型(Hidden Markov Model,HMM)和人工神经元网络(Artificial Neural Networks,ANN)。DTW是较早的一种模式匹配和模型训练技术,它应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题,在简短词语音识别中获得了良好性能。
人们有时候通常会发出某些特殊的语音,比如尖叫声,语音突发事件检测通过对这种特殊声音进行识别来实现事件检测,属于孤立词,特定人,小词汇量的语音识别系统。对于语音突发事件的检测,由于输入信号类似于单音信号,因此所需要的匹配模板可以较少。用于此类识别时,DTW算法与HMM算法在相同的条件下,识别效果相差不大,但HMM算法更复杂,主要体现在HMM算法在训练阶段需要提供大量的语音数据,通过反复计算才能得到的模型参数,而DTW算法的训练中几乎不需要额外的计算。
发明内容
本发明的目的在于克服现有技术的上述不足,提供一种能够提高判断速率和语音识别正确率的突发事件语音检测方法。为此,本发明采用如下的技术方案:
一种突发事件语音检测方法,包括下列步骤:
1)确定合适的采集频率,采集对突发事件应激反应所产生的语音模板信号,对其进行分帧处理;
2)分别提取模板信号的MFCC和LPCC的特征系数;
3)采用相同的采集频率采集待检测信号;
4)提取待检测信号两个连续帧中的第一帧的MFCC特征系数,设模板信号的MFCC特征系数和待检测信号的MFCC特征系数的匹配距离为dist1,若匹配距离dist1低于预设的第一判决门限T1时,判断认为该待检测信号与模板信号相匹配,为目标信号,结束本次检测,否则,执行下一步;
5)若匹配距离大于T1但小于预设的第二判决门限T2,则判断该信号有极大可能性是目标信号,并执行下一步,否则,认为该信号不是目标信号,结束本次检测;
6)对于待检测信号的下一帧,提取其LPCC特征系数,利用动态时间归正模式识别方法,计算模板信号的LPCC特征系数和待检测信号的LPCC特征系数的匹配距离dist2,若dist2小于预设的第三判决门限T3,则认为该信号为目标信号,否则,判断该信号不是目标信号。
作为优选实施方式,本发明的突发事件语音检测方法,在提取MFCC或LPCC特征系数时候,还包括对模板或待检测信号的一阶差分信号进行特征提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110160096.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:大通流电源模块浪涌保护器
- 下一篇:一种响指节奏器生产方法及使用方法