[发明专利]基于稀疏分解与重构的鲁棒语音特征提取方法有效
申请号: | 201110283908.4 | 申请日: | 2011-09-22 |
公开(公告)号: | CN102290047A | 公开(公告)日: | 2011-12-21 |
发明(设计)人: | 韩纪庆;何勇军 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 牟永林 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于稀疏分解与重构的鲁棒语音特征提取方法,涉及稀疏分解与重构的语音特征提取方法,解决了1、原子字典的选取:具有较高的时间复杂度,而且难以满足信号投影后稀疏;2、信号的稀疏分解:考虑语音信号和噪声信号的时间相关性的较少;3、信号的重构:忽略了原子的先验概率以及各个原子相互转换的概率的问题,它包括具体步骤如下:步骤一、预处理;步骤二、作离散傅立叶变换,并求功率谱;步骤三、原子字典训练,保存;步骤四、稀疏分解;步骤五、语音谱重构;步骤六、加梅尔三角滤波器并取对数;步骤七、得到梅尔倒谱系数与梅尔倒谱稀疏拼接,形成鲁棒特征。用于多媒体信息处理领域。 | ||
搜索关键词: | 基于 稀疏 分解 语音 特征 提取 方法 | ||
【主权项】:
1.基于稀疏分解与重构的鲁棒语音特征提取方法,其特征是它包括具体步骤如下:步骤一、预处理,将读入的语音进行分帧、加窗,使语音从时间序列转变为帧序列;步骤二、作离散傅立叶变换,并求功率谱:式中x(n)为加窗后的语音帧,N表示傅立叶变换的点数;判断是否进行原子字典训练,否,执行步骤四;步骤三、原子字典训练,保存;利用算法I,从大量语音中选取样本作为字典原子;步骤四、稀疏分解;步骤五、语音谱重构;步骤六、加梅尔三角滤波器并取对数;定义一个有M个滤波器的滤波器组即滤波器的个数和临界带的个数相近,采用的滤波器为三角滤波器,中心频率为f(m),m=0,2,...,M-1,滤波器组中每个三角滤波器的跨度在梅尔标度上是相等的;三角滤波器的频率响应定义为:H m ( k ) = 0 k < f ( m - 1 ) ork > f ( m + 1 ) 2 ( k - f ( m - 1 ) ) ( f ( m + 1 ) - f ( m - 1 ) ) ( f ( m ) - f ( m - 1 ) ) f ( m - 1 ) < k < f ( m ) 2 ( f ( m + 1 ) - k ) ( f ( m + 1 ) - f ( m - 1 ) ) ( f ( m + 1 ) - f ( m ) ) f ( m ) ≤ k ≤ f ( m + 1 ) ]]> 对功率谱加梅尔滤波器组:S ( m ) = ln ( Σ k = 0 N - 1 | X a ( k ) | 2 H m ( k ) ) , 0 ≤ m < M ; ]]> 步骤七、经离散余弦变换得到梅尔倒谱系数:c ( n ) = Σ m = 0 M - 1 S ( m ) cos ( nπ ( m - 0.5 ) / M ) , 0 ≤ n ≤ M , ]]> 计算一阶差分和二阶差分,与梅尔倒谱稀疏拼接,形成鲁棒特征。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110283908.4/,转载请声明来源钻瓜专利网。
- 上一篇:化学方法
- 下一篇:一种转台左右半轴调节同心度的方法