[发明专利]基于稀疏分解与重构的鲁棒语音特征提取方法有效
申请号: | 201110283908.4 | 申请日: | 2011-09-22 |
公开(公告)号: | CN102290047A | 公开(公告)日: | 2011-12-21 |
发明(设计)人: | 韩纪庆;何勇军 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 牟永林 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 稀疏 分解 语音 特征 提取 方法 | ||
技术领域
本发明涉及稀疏分解与重构的语音特征提取方法。
背景技术
让机器能像人一样感知和理解语音一直是人类的梦想,语音识别为这一梦想带来了希望。经过几十年发展,语音识别技术取得了巨大成就,从最初的孤立词识别到如今的大词表连续语音识别(Large Vocabulary Continue Speech Recognition,LVCSR),语音识别技术已经迈出实验室并逐步走向应用。在理想环境下,目前的小词表以及中等词表识别系统的识别率能达到99%以上,LVCSR系统识别率也能超过95%,但在噪声情况下,识别率将急剧下降。数十年来,研究者们尝试用各种方法来增强语音识别系统的鲁棒性,虽取得了一定进展,但目前的语音识别系统仍然难以适应复杂的应用环境。
噪声在现实应用中广泛存在,这些种噪声可能是加性的,可能是卷积性的,也可能是两者的混合。一般认为,外部环境噪声呈加性,信道影响呈卷积性。特别地,当训练环境没有噪声而测试环境存在噪声,或者训练环境和测试环境存在不同的噪声,将会引起环境失配。环境失配必然导致语音特征参数的分布存在偏差进而影响系统性能。
为了增强语音识别系统的环境鲁棒性,研究者们提出了大量的方法。这些方法大致可分为两类,即特征增强和模型补偿。特征增强试图从畸变语音中提取鲁棒特征。这类方法或先对信号去噪然后提取特征,例如谱减,维纳滤波,卡尔曼滤波,子空间法等,或直接补偿特征,例如倒谱均值方差规正(Cepstral Mean Normalization,CMN),特征弯折,短时高斯化,相关谱滤波(RelAtive SpecTrAl,RASTA),非线性滤波等。模型补偿则试图修改声学模型来适应环境,典型的有并行混合模型(Parallel Model Combination,PMC),泰勒级数展开(Vector Taylor Series,VTS)以及各种自适应方法如最大似然线性回归(Maximum Likelihood Linear Regression,MLLR),最大后验概率(Maxi-mum A-Posteriori,MAP)等。
虽然研究者们提出了各种方法试图解决语音识别系统的噪声鲁棒性问题,但其效果仍然无法满足现实应用需求。一方面,应用环境复杂多变,存在着各种难以预测的时变噪声;另一方面,目前的方法普遍基于噪声的平稳性假设,且需要对噪声建模以实现噪声谱的估计。这决定了目前的方法在噪声平稳时能取得较好的效果,在复杂的时变噪声情况下无法取得理想的效果。
近年来,随着稀疏分解与重构理论的成熟,信号的稀疏表示在信号处理各个领域展示出了巨大的潜力。信号满足稀疏性是指信号被分解在某个原子字典上时,仅有少量原子的系数不为零。现实中的大量信号,诸如图像,语音等都满足稀疏性或近似稀疏。另一方面,从人的认知角度上看,大量研究表明,人的感知神经系统总是从海量的神经元中,同时激活极少一部分以实现对外部刺激的编码。也就是说,人在感知外部刺激获取信息时,也遵从稀疏性原则。信号的稀疏表示在信号压缩、分析、去噪等各个方面均表现出了巨大的潜力。
信号的稀疏分解与重构存在的问题:
1、原子字典的选取:目前的各种方法大多需要反复迭代,具有较高的时间复杂度,而且难以满足信号投影后稀疏;
2、信号的稀疏分解:目前的稀疏分解方法满足的准则有稀疏性和重构误差最小准则,考虑语音信号和噪声信号的时间相关性的较少;
3、信号的重构:目前的方法大多数等概率地考虑原子的贡献,忽略了原子的先验概率以及各个原子相互转换的概率。
发明内容
本发明的目的是为了解决现有1、原子字典的选取:具有较高的时间复杂度,而且难以满足信号投影后稀疏;2、信号的稀疏分解:考虑语音信号和噪声信号的时间相关性的较少;3、信号的重构:忽略了原子的先验概率以及各个原子相互转换的概率的问题,提供一种基于稀疏分解与重构的鲁棒语音特征提取方法。
基于稀疏分解与重构的鲁棒语音特征提取方法,它包括具体步骤如下:
步骤一、预处理,将读入的语音进行分帧、加窗,使语音从时间序列转变为帧序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110283908.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:化学方法
- 下一篇:一种转台左右半轴调节同心度的方法